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La presente invention est relative a des sequences nucleiques issues 
d'un erythrovirus humain, a leurs fragments ainsi qu'a leurs applications, en tant que 
reactif de diagnostic et en tant qu'agent immunogene. 

Les etudes sero-epidemiologiques montrent que Tinfection par le 
5 parvovirus B19, recemment renomme erythrovirus B19, est communement et large- 
ment repandue dans le monde entier. 

En Europe, la seroprevalence pour 1' erythrovirus B19 est d'environ 
10 % chez les sujets de moins de 5 ans, d'environ 50 % pour les sujets de plus de 20 
ans et superieure a 90% chez les personnes agees. 
10 Le taux eleve de seroprevalence suggere que T erythrovirus B19 est 

tres contagieux. Lors d'epidemies, le taux de transmission a des sujets en contact 
rapproche est de 10 a 60 %, la voie de transmission etant principalement aerienne 
(secretions respiratoires). 

L' erythrovirus B19 est un virus specifiquement humain. L'infection 
15 aigue entraine communement une eruption cutanee maculo-papuleuse benigne chez 
Tenfant (megalerytheme epidermique ou 5™ maladie). Des arthralgies peuvent accom- 
pagner Teruption, et exceptionnellement devenir chroniques. 

Une crise erythroblastique aigue transitoire survient habituellement, 
chez les patients deja porteurs d'une anemie hemolytique chronique (drepanocytose, 
20 thalassemie, deficit en pyruvate kinase...), entrainant une anemie aigue aregenerative 
transitoire. 

La primo-infection aigue par 1' erythrovirus B19 est particulierement 
dangereuse chez la femme enceinte avec un risque de transmission au foetus estime a 
30 %. Le risque de mort foetale est estime entre 5 et 9 % par anemie, insuffisance 
25 hepatique, insuflRsance cardiaque et anasarque foeto-placentaire. 

Les infections chroniques a erythrovirus B19 se rencontrent essentiel- 
lement chez les sujets immunodeprimes (leucemie myeloi'de chronique, deficit immuni- 
taire humoral et cellulaire, greflfes d'organe ou de moelle, malades du SID A). 

Chez les patients VEH-l seropositifs, Tinfection chronique par ery- 
30 throvirus B19 est responsable d'anemie chronique, mais peut egalement agir sur les 
autres lignees (neutropenie et surtout thrombopenie). L'absence de reponse immuni- 
taire humorale sufBsante chez ces patients permet I'installation d'une erythroviremie 



chronique et explique a la fois I'erythroblastopenie chronique et I'absence des autres 
symptomes tels que le rash ou les arthralgies. 

L'erythrovims B19 est un virus a genome ADN a simple brin 
d'environ 5,4 kbases ; c'est le seul erythrovirus repertorie a ce jour ; toutes les souches " 
5 qui ont ete sequencees et qui ont fait I'objet d'une publication dans les banques de 
sequences (GenBank ou EMBL) presentent une faible variabiUte genetique, (98 % de 
similitude en sequence nucleotidique sur Tensemble du genome et 96 % de similitude 
sur la region VPl) (R.O. SHADE, J. Virol, 1986, 58, 3, 921-936, B19-AU). 

Le diagnostic virologique des infections a erythrovirus B19 repose 
10 essentiellement sur la detection du genome viral, dans la mesure ou la culture n'est pas 
realisable en routine. 

Pour les infections aigues, a erythrovirus B19 (primo-infections), 
cette detection peut se faire par amplification genique (PGR), mais aussi par hybrida- 
tion (dot-blot), compte tenu du titre viral, habituellement tres eleve lors des primo- 
15 infections O'usqu'a lO^'/ml de serum) ; toutefois, le titre viral est beaucoup plus feible 
lors des infections chroniques et seule une methode de detection par ampUfication 
genique est envisageable. 

Ces techniques de detection sont tributaires de la variabiUte genetique 
du virus recherche ; les reactifs, prepares a partir des sequences d' erythrovirus B19 
20 connues, ne permettent pas de detecter les infections a eiythrovirus variant, ni par 
amplification genique, ni par le serodiagnostic B 19. 

En eflfet, les tests serodiagnostics existants sont specifiques de 
rerythrovirus B19 (Demande Internationale PCT WO 91/12269 ; Demande Inter- 
nationale PCT WO 96/09391 (IDEIA® Parvovirus B19 IgG et IgM, DAKO ; Parvo- 
25 virus B 1 9 IgG et IgM Enzyme Immunoassay, BIOTRIN)). 

Ett coiiscquciice, les techniques de detection precisees d-dessus 
risquent d'aboutir a des resultats negatifs tant au niveau nucleique qu'en ce qui 
conceme la reponse en anticorps. 

La mise en evidence et la prise en compte de nouveaux variants sont 
30 importantes pour mettre au point : 

- des reactifs de detection et de diagnostic des infections a erythro- 
virus humain (serodiagnostic, PGR, hybridation), suffisamment sensibles et specifiques. 




• 
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c'est-a-dire ne conduisant pas a des resultats faussement negatifs ou faussement 
positifs, 

- des compositions aptes a proteger vis-a-vis de Tensemble des 
infections a erythrovirus (vaccins) et 



(serotherapie, anticorps monoclonaux). 

Les Inventeurs se sont done donne pour but de pourvoir a des 
sequences issues d' erythrovirus, aptes a permettre la detection d'un erythrovirus 
variant (denomme erythrovirus de type V9), c'est-a-dire genetiquement eloigne de 

10 1' erythrovirus B 19. 

La present e invention a pour objet une sequence d'acide nucleique, 
caracterisee en ce qu'elle est selectionnee dans le groupe constitue par les sequences 
issues d'un erythrovirus, qui, moleculairement, ne peut etre reconnu conime un ery- 
throvirus B19, et denomme variant de type V9, car presentant une divergence ou 

15 distance genetique > 10 % sur Tensemble du genome par rapport aux sequences de 
r erythrovirus B19, la sequence SEQ ID N0:1 et les sequences nucleotidiques capables 
de s'hybrider avec ladite sequence ID NO: 1 . 

La sequence SEQ ID NO:l presente une carte de restriction difFe- 
rente de celle des erythrovirus B19, notamment pour ce qui conceme les sites BamHI 

20 (aucun site), HindlH (un seul site) et PvuII (cinq sites). 



profil de restriction different de celui de T erythrovirus BI9, notamment par les sites de 
restriction suivants : Acc I, Afl m, Alw I, AlwN I, A pa I, Ava I, Ava 11, Avr n, 
BamH I, Ban I, Ban n, Bbe I, Bbs I, BceF I, Beg I, Ben I, Bgl II, Bsg I, BsiE I, Bsm 

25 I, BsmA I, Bspl20 I, BspH I, BspM I, BsrF I, Bstl 107 I, BstE II, BstU I, Bsu36 I, 
Dpn I, Dra IH, Dsa I, Eae I, Eag I, Ear I, EcI136 I, EcoN I, Ecol09 I, EcoR I, Ehe I, 
Fok I, Hae I, Hae m, Hga I, HgiA I, Hha I, Hinc H, Hind m, HinP I, Hpa I, Kas I, 
Mae n, Mbo I, Mcr I, Msc I, Mun I, Nar I, Nci I, Nco I, Nsi I, Nsp I, Nsp7524 I, 
NspB n, NspC I, PflM I, Pme I, PpuIO I, PpuM I, Pst I, Pvu II, Sac I, Sau3 A I, Sea I, 

30 SfaN I, Sfc I, Sma I, Spe I, Sph I, Ssp I, Stu I, Sty I, Swa I, Tthl 1 1 I, Xba I, Xma I et 
leurs isoschizomeres. 
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- des compositions aptes a traiter une infection a erythrovirus variant 



De maniere plus precise, la sequence SEQ ID NO:l presente un 



La presente invention a egalement pour objet des fragments de la 
sequence ID N0:1, aptes a penmettre la detection d'un erythrovims V9 et caracterises 
en ce qu'ils comprennent une sequence nucleotidique selectionnee dans le groupe 
- -constitue par : - . . . . . . 

5 a) une sequence correspondant aux positions 328-2340 de la SEQ ID NO:l, codant 
pour la proteine NSl (SEQ ID NO: 81), 

b) une sequence correspondant aux positions 1796-2017 de la SEQ ID NO:l, codant 
pour la proteine de 7,5 kDa (SEQ ID NO:83), 

c) une sequence correspondant aux positions 2336-4678 de la SEQ ID NO:l, codant 
10 pour la proteine VP 1 (SEQ ID NO:85), 

d) une sequence correspondant aux positions 2336-3016 de la SEQ ID NO:l, codant 
pour la proteine VPlu (SEQ ID NO;87), 

e) une sequence correspondant aux positions 2523-2828 de la SEQ ID NO:l, codant 
pour la proteine X (SEQ ID NO:89), 

15 f) une sequence correspondant aux positions 3017-4678 de la SEQ ID NO:l. codant 
pour la proteine VP2 (SEQ ED NO:91), 

g) une sequence correspondant aux positions 4488-4883 de la SEQ ID NO:l, codant 
pour la proteine de 1 1 kDa (SEQ ID NO;93), 

h) une sequence nucleotidique capable de s'hybrider avec I'une des sequences SEQ ID 
20 NO.l. SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87. SEQ ID 

NO:89. SEQ ED N0.91 ou SEQ ID NO:93, 

i) les sequences SEQ ID NO:2-80, 

j) les sequences SEQ ID NO:105 (E19050, 106 (E1987r), 107 (E2076f), 108 
(E2151r). 109 (E2406r), 110 (E2149rs). 1 1 1 (E2717f) et 1 12 (E2901r) et 
25 k) les sequences complementaires des sequences precedentes, les fragments issus des 
sequences precedentes d' a u moin s 17 nucleotides ou l o urs s e qu e nc e s coi i iplementaires. 



Au sens de la presente invention, on entend par sequence nucleique 
ou sequence nucleotidique (sequence d'ADN ou d'ARN), Tune des sequences, telles 
que definies ci-dessus et leurs sequences complementaires (sequences anti-sens) ainsi 
30 que les sequences comprenant une ou plusieurs desdites sequences ou fragments de 
celles-ci. 



L'invention englobe ^galement des fragments nucltotidiques 
complementaires des precedents ainsi que des fragments modifies par rapport aux pr6- 
c6dents, par enl^ement ou addition de nucleotides dans une proportion d' environ 
15 %, par rapport k la longueur des fri^ments d-dessus et/ou modifi^ ati niveau de la 
nature des nucleotides, des lors que le» fragments nucleotidiques modifi^ conservent 



une capacity d'hybridafion avec la silence d'ADN ou d'ARN d'drythrovinis V9, 
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analogue k celle que presentent les fia^ueiits correspondants non modififa.S^ 

Certains de ces fiaMnents sont sp^dfiques et sont iitiUs6s , conime 
sonde ou amorce ; Us s'hybridcrt^^^^ient a un irythrovirus VS^^^^to^ 
virus apparent^ ; on entend'^^^^&te a reiythrovirus V9,;^^^^^ 
presentant une divergence gtoSl^^^^ ; ces fragments sont s^ec^^^ans te 
groupe constitu^ par les seque^^E^fS NO:45-80 et NO: 108 cgJ^Sa leurs 
sequences complementaires, les s^^iM issues de ces sequences d^au^^ms 17 



nucleotides et les sequences comprl^^^^es sequences et trouvent ap||^^6n dans 
15 I'identification specifique d'un irytbrcMr^ ou d'un erythrovirus appa^^.^^ -^^i i^^^^^^^^^ 

ramplification de sequences iss,^^^m>virus de type V9 ou ^^^g;ig. 
que la sequence SEQ ID NO:l ;'o§^^S Ibnt choisies dans le groi^^p^e |»r.' 



les sequences SEQ ID N0:2-#^^^pces SEQ ID NO: 105.1(^^^^g 



20 leurs sequences compltoentiun^^ 



moins 17 nudeptidi».#^^'teilJI" 



25 rentidle des erjtkwirw ( 

sondes telles que denies d-Klesauk^-^ 

■; . ^-TSgJiili/LiBsdites amorpes:''~* 

tides : des amorces preferees,^spnt 

■ ■ ■ ■ ■■•^iii 




iiquences issues desdites ' 



appticatiOT^'pouo' ri 

«^ enzymes de r^^ction 
--fflit de preference-entredl 
: la sequence |SEQ 



tions 1797-1815 de la sequenoB^SEQ qui correspond i 

30 sequence SEQ ID NO: 10, ia^^^^^EQ^ID NO: 106 (poatipS 
sequence SEQ ID NO:l), qm j 

sequence SEQ ID N0:11, li se^^^Q.ip NO:ip7 (poatioM 





mm. 




sequence SEQ ID N0:1). qui correspond a un fragment de la sequence SEQ ID 
NO:13, la sequence SEQ ID NO.IOS (positions 2061-2043 de la sequence SEQ ID 
NO:l), qui correspond a un fragment de la sequence anti-sens de la sequence SEQ ID 
NO:58, la sequence SEQ ID NO:109 (positions 2317-2298 de la sequence SEQ ID 
5 NO: 1), qui correspond a un fragment de la sequence anti-sens de la sequence SEQ ID 
N0:I6, la sequence SEQ ID NO.lll (positions 2609-2627 de la sequence SEQ ID 
NO:l), qui correspond a un fragment de la sequence SEQ ED NO: 19 et la sequence 
SEQ ID NO:112 (positions 2812-2793 de la sequence SEQ ID NO:l), qui correspond 
a un fragment de la sequence anti-sens de la sequence SEQ ID NO:23. 

Des paires d'amorces preferees sont les suivantes : 

- paire A : amorces SEQ ID NO: 1 1 1 et SEQ ID NO: 112; 

- paire B : amorces SEQ ID NO: 105 et SEQ ID NO: 1 06 ; 

- paire C : Tune des sequences SEQ ID NO :2-44, 105, 106, 107, 
109, 1 1 1 ou 1 12 et Tune des sequence SEQ ID NO:45-80, 108 ou 1 10 ; 

- paire D : amorce SEQ ID NO: 107 et amorce SEQ ID NO: 109; 

- paire E : deux amorces selectionnees parmi les s^uences SEQ ID 
NO:2-44. 105, 106, 107, 109, 1 11 ou 112 ; 

- paire F : deux amorces selectionnees parmi les sequences SEQ ID 
NO:45-80, 108 ou 110. 

Ces diflferentes amorces peuvent 6tre utilisees, selon le fragment 
amplifie, comme amorce sens ou comme amorce anti-sens. 

La presente invention a egalement pour objet un erythrovirus variant, 
caracterise en ce qu'il ne peut etre reconnu moleculairement comme un erythrovirus 
B19, en ce qu'il presente une divergence genetique < 10 % avec I'erythrovirus V9, tel 
25 que defini ci-dessus et en ce que son genome s'hybride specifiquement avec Tune des 
sequences SEQ ID NO:45 a 80, 108 et 1 10, telle que definie ci-dessus. 

La presente invention a egalement pour objet un plasmide, caracterise 
en ce qu'il comprend le genome viral d'une souche d* erythrovirus variant, denommee 
erythrovirus V9, ne pouvant etre reconnue moleculairement comme un erythrovinis 
30 B19 et presentant avec ce dernier une divergence genetique > 10 % sur I'ensemble du 
genome, par rapport aux sequences de I'erythrovirus B 19. Le genome viral dudit ery- 
throvirus V9 est considere comme genetiquement eloigne de I'erythrovirus B19. 



Selon un mode de realisation avantageux dudit plasmide, 11 inclut la 

sequence SEQ ID NO : 1 . 

Conformement a ce mode de realisation, ledit plasmide a ete depose 
aupres de la Collection Nationaie de Culture de Microorganismes (CNCM) en date du 
18 novembre 1997 sous le n° 1-1940, incorpore dans une bacterie Escherichia coli. 

La presente invention a egalement pour objet un reactif de diagnostic 
pour la detection difFerentielle des erythrovirus de type V9, caracterise en ce qu'il est 
selectionne parmi les sequences SEQ ED NO:45-80, 108 et 110, eventueUement 
marquees avec un marqueur approprie. 

Parmi ies marqueurs appropries, on peut citer, les isotopes radio- 
actifs, les enzymes, les fluorochromes, des marqueurs chimiques (biotine...), les 
haptenes (digoxygenine...) et les anticorps ou analogues de bases appropriees. 

La presente invention a egalement pour objet un precede de detec- 
tion rapide et differentiel des erythrovims, par hybridation et/ou amplification genique, 
realise a partir d'un echantillon biologique, lequel procede est caracterise en ce qu'il 
comprend : 

(1) une etape dans laquelle Ton met en contact un echantillon biolo- 
gique a analyser avec au moins une sonde de sequence SEQ ED NO:45-80, 108 ou 1 10 
et 

(2) une etape dans laquelle on detecte par tout moyen approprie le ou 
les produits resultant de I'interaction sequence nucleotidique d'erythrovirus-sonde. 

De maniere preferee, Thybridation comprend une prehybridation est 
realisee dans un tampon qui comprend 5-60 % de formamide ; 1-5X SSC ; 2 % de 
reactif de blocage {Blocking buffer, Boehringer Mannheim. Meylan, France) ; 0,1 % de 
N-lauryl sarcosine ; 0,01-5 % de SDS, a 40-70°C pendant 90 minutes, puis I'hybrida- 
tion est realisee dans 3 ml d'un tampon de meme composition avec 10 ^l de sonde 
marqude a 40-70°C pendant 1-30 heures. 

Conformement audit procede, il peut comprendre, prealablement a 

I'etape (1) : 

. une etape d'extraction de I'acide nucleique k detecter, appartenant 
au genome du virus, eventueUement present dans 1' echantillon biologique, et 
. au moins un cycle d'amplification gdnique. 



L'etape d'amplification genique est notamment realisee a I'aide d'une 
des techniques d'amplification genique suivante : ampUfication par la QP-replicase (I. 
Haruna et al., Proc. Nat. Acad. Sci. USA, 1965. 54, 579-587), PCR (reaction de poly- 
merisation en chaihe) (R.K. Saiki et al., 1986.-Nature, 324: 163-6) LCR {ligase chain 
5 reaction) (F. Barany, Proc. Nat. Acad. Sci. USA, 1991, 88, 189-193), ERA (end-run 
amplification) (C. Adams et al., 1994, Novel amplification technologies for 
DNA/RNA-based diagnostics meeting, San Francisco, CA, Etats-Unis), CPR (cycling 
probe reaction) (P. Duck et al.. Biotechniques. 1990, 9, 142-147) ou SDA (sti-and 
displacement amplification) (GT. Walker, 1994. SDA: novel amplification 
10 technologies for DNA/RNA-based diagnostics meeting, San Francisco, CA, Etats- 
Unis). 

Selon un mode de mise en oeuvre avantageux dudit procede, les 
cycles d'amplification sont realises a I'aide d'une paire d'amorces selectionnee pamii 
les sequences SEQ ID NO:2-44, 105-109 et 111-112 et les fragments de ces 
15 sequences, de maniere preferee parmi les paires d'amorces telles que definies ci-dessus. 

Lorsque I'on utilise la paire A, le produit d'amplification est avanta- 
geusement crible par action de I'enzyme de restriction Apa I : le produit d'amplification 
d'un genome B19 est clive par Apa I (generant 2 fi-agments de 149 et 55 paires de 
bases (pb)) alors que le produit d'amplification d'un genome V9 n'est pas clive par Apa 
20 I (un fi-agment de 204 pb) ; une electrophorese sur gel d'agarose ou d'aciylamide - 
permet de distinguer ces fi-agments de restriction. 

Lorsque I'on utilise la paire B, le produit d'amplification est avanta- 
geusemem crible par action de I'une des enzymes de restrictions suivantes : BglH, ou 
Muni ; on obtient ainsi dififerents firagments selon qu'il s'agit d'un erythroviurs V9 ou 
25 B19; un fi-agment qui comprend un site de restriction Bglll est specifique de 
I'erythrovirus V9 variant tel que defini ci-dessus, alors que les erythrovirus B19 
comprennent dans cette zone, un site Muni. Le produit d'amplification d'un genome 
B19 est clive par Muni (generant 2 fi-agments de 36 et 67 pb) et n'est pas clive par 
Bgin (un fragment de 103 pb) alors que le produit d'amplification d'un genome V9 est 
30 cUve par BglH (2 fi-agments de 19 et 84 pb) et n'est pas clive par Muni (un fi-agment 
de 1 03 pb) ; une electrophorese sur gel d'agarose ou d'aciylamide permet de distinguer 
ces differents fragments de restriction. 



Lorsque Ton utilise ia paire C (une amorce apte a hybrider avec tous 
les erythrovirus et une amorce apte a hybrider de maniere specifique avec rerythrovirus 
V9) ou la paire F (deux amorces aptes a hybrider de maniere specifique avec 
rerythrovirus V9), le genome V9 est amplifie alors qu'il n'y a pas d'amplification speci- 

5 fique avec le genome B19. 

Lorsque Ton utilise la paire D, le produit d'amplification est avanta- 
geusement crible par hybridation avec une sonde specifique marquee de I'erythrovirus 
V9, selectionnee parmi les sequences SEQ ID NO:58-60 et 110, de preference par 
hybridation avec la sonde de sequence SEQ ID NO: 110 ; le produit d'amplification d'un 

10 genome V9 hybride de maniere specifique avec ces sondes et notamment la sonde de 
sequence SEQ ID NO: 110, alors que le produit d'amplification d'un genome B19 
n'hybride pas avec les sondes precitees. 

Lorsque I'on utilise la paire E, le produit d'amplification est crible 
par tout procede d'hybridation avec une sonde specifique de I'erythrovirus V9 selec- 

15 tionnee parmi les sequences SEQ ID NO:45-80. 108 et 1 10 ; dans ce cas, le produit 
d'amplification d'un genome V9 hybride avec la sonde, mais pas le produit 
d'amplification d'un genome B 19. 

L'invention a egalement pour objet I'utilisation des sequences 
decrites ci-dessus, de fi-agments issus de ces sequences ou de leurs coraplementaires, 

20 pour la mise en oeuvre d'un procede d'hybridation ou d'amplification genique de 
sequence nucleiques d' erythrovirus, ces procedes etant applicables au diagnostic in 
vitro de I'infection potentielle d'un individu par un erythrovirus de type V9. 

La presente invention a egalement pour objet un procede de criblage 
et de typage d'un erythrovirus V9 ou apparente, caracterise en ce qu'il comprend la 

25 mise en contact d'une sonde selectionnee dans le groupe constitue par les sequences 
SEQ ID NO:45-80, 108 et 110, eventuellement marquee, avec I'acide nucleique du 
virus a typer et la detection de I'hybride acide nucleique-sonde obtenu. 

La presente invention a egalement pour objet des produits de traduc- 
tion, caracterises en ce qu'ils sont cod6s par une sequence nucleotidique telle que defi- 

30 nie ci-dessus. 

La presente invention a egalement pour objet une proteine, caracteri- 
see en ce qu'elle est notamment susceptible d'etre exprimee a I'aide d'une sequence 
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nucleotidique selectionnee dans le groupe constitue par les sequences SEQ ID NO: 81, 
83. 85, 87, 89, 91 et 93, telles que definies ci-dessus et les peptides derives comprenant 
entre 7 et 50 amino-acides. 

On entend par peptide, ci-apres, aussi bien les proteines que les 
5 peptides, tels que definis ci-dessus. 

De tels peptides sont notanuneiit aptes a €tre reconnus par des anti- 
corps induits par un erythrovirus V9 et/ou a induire la production d'anticorps anti- 
erythrovirus V9. 

Lesdits peptides sont notamment selectionnes parmi les sequences 
10 SEQ ID NO:82 (proteins NSl), SEQ ID NO:86 (proteine VPl). SEQ ID NO:88 
(proteine VPl unique), SEQ ID NO:92 (proteine VP2) et SEQ ID NO:95.I04, a 
savoir des fragments de la proteine VPl [peptide VPla (SEQ ED NO:95) ; peptide 
VPlb (SEQ ID NO:96) ; peptide VPlc (SEQ ID NO: 97) peptide VPld (SEQ ID 
NO:98) ; peptide VPle (SEQ ID NO:99 et peptide VPlf (SEQ ID NO:100)]. ou des 

15 fiagmentsde la proteine VP2 [peptide VP2a (SEQ ID NO:101); peptide VP2b (SEQ 
ID NO:102) ; peptide VP2c (SEQ ID NO: 103) ; peptide VP2d (SEQ ID NO:104] ainsi 
que les peptides derives comprenant 7 a 50 aminoacides. 

L'invention a egalement pour objet des compositions immunogenes 
comprenant un ou plusieurs produits de traduction des sequences nucleotidiques selon 
20 l'invention et/ou I'un des peptides tels que definis ci-dessus. obtenus, notamment de 
maniere synthetique. 

L'invention a egalement pour objet les anticorps diriges contre I'un 
ou plusieurs des peptides decrits ci-dessus et leur utUisation pour la mise en oeuvre 
d'une methode de diagnostic in vitro, notamment dififerentielle de I'infection d'un indi- 
25 vidu par un erythrovirus. 

La presente invention a egalement pour objet un precede de detec- 
tion immunologique d'une infection a erythrovirus V9, caracterise en ce qu'il 
comprend : 

- pour la detection des anticoips anti-erythrovirus V9, la mise en 
30 contact d'un 6chantiUon biologique avec un peptide selon l'invention (serodiagnostic). 

- pour la detection des proteines virales d'erytiirovirus V9, la mise en 
contact d'un echantiUon biologique avec un anticorps selon I'mvention ; 
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la lecture du resultat etant revelee par un moyen approprie, notam- 

ment EIA, ELIS A, RIA, fluorescence. 

A titre d' illustration, une telle methode de diagnostic in vitro selon 

r invention comprend la mise en contact d'un echantillon biologique preleve chez un 
5 patient, avec des anticorps selon I'invention ou des peptides selon Tinvention, et la 

detection a 1' aide de tout procede approprie, notamment a I'aide d'anti-immuno- 

globulines marquees, des complexes inununologiques formes entre les antigenes ou les 

anticorps des erythrovirus eventuellement presents dans T echantillon biologique et 

lesdits anticorps ou lesdits peptides, respectivement. 
10 Les reactifs selon 1' invention sont notamment utiles pour la detection 

des erythrovirus V9 et apparentes chez les femmes enceintes, chez les patients VIH- 

positifs presentant une anemie et/ou une thrombopenie chronique, les grefFes d'organe 

ou de moelle, et les patients presentant une anemie aigue centrale et dont les tests de 

detection de T erythrovirus B 19 sont negatifs. 
15 L'invention a en outre pour objet une trousse de diagnostic 

d'erythrovirus, caracterisee en ce qu'elle inclut au moins un reactif selon Tinvention 

(sondes, paires d' amorces, peptides ou anticorps). 

Outres les dispositions qui precedent, T invention comprend encore 

d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a des 
20 exemples de mise en oeuvre du procede objet de la presente invention ainsi qu'aux 

dessins annexes, dans lesquels : 

- les figures 1, 2 et 3 illustrent les arbres phylogenetiques de 
r erythrovirus V9 : figure 1 : arbre phylogenetique de la sequence complete 
d'erythrovirus ; figure 2 : arbre phylogenetique des genes NSl d' erythrovirus ; figure 

25 3 : arbre phylogenetique des genes VPl d* erythrovirus ; 

- les figures 4, 5 et 6 representent les distances genetiques des 
sequences completes d'erythrovirus (figure 4), des genes NSl (figure 5) et des genes 
VPl (figure 6) d'erythrovirus. 

- la figure 7 illustre la carte de restriction de la sequence ID NO: 1 . 

30 n doit etre bien entendu, toutefi^is, que ces exemples sont donnes 

uniquement a titre d' illustration de I'objet de I'mvention, dont ils ne constituent en 
aucime maniere une limitation. 
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EXEMPLE 1 : Obtention des sequences conformes a rinvention. 

Un fragment de restriction Aat II/Aat II de 5 028 pb representant la 
quasi totalite (95 %) du genome du variant V9 a ete clone dans le vecteur de sequen- 

fage pcDNA2. 1 (Invitrogen, Netherlands) de la fa9on suivante. 

5 L'ADN viral simple brin est extrait du serum d'un patient presentant 

una crise erythroblastopenique aigue a I'aide d'une colonne QIAamp Blood Kit (Qiagen 
S.A., France). Par une etape d'hybridation dans un tampon NaCl 50 mM a 56°C 
pendant 16 heures, I'ADN viral est transforme en ADN double brin. Puis 1,3 ng d'ADN 
viral double brin est soumis a I'enzyme de restriction Aat U (18 U) a 37°C pendant 2 
10 heures, I'enzyme de restriction est ensuite inactivee a 65°C pendant 15 minutes. Le 
produit est dialyse sur membrane d'acetate et de nitrate de cellulose MiUipore® 
VSUTO 13000 contre de I'eau pendant 2 heures. Le fragment de restriction Aat II/Aat 
n d'ADN viral double brin ainsi prepare est congele a -20°C en attendant I'etape de 
ligation. 

Le vecteur pcDNA2.1 est modifie pour recevoir le fragment Aat n 
par mutagenese dirigee insertionnelle : le site de restriction Eag I du multisite de 
clonage a ete supprime et remplace par un site Aat H. Le vecteur pcDNA2.1a, ainsi 
produit, est amplifie en culture bacterienne et purifie a I'aide d'un QIAfilter Plasmid 
Maxi Kit (Qiagen S.A., France). Puis 3 ng du vecteur pcDNA2.1a est soumis a une 
20 restriction par I'enzyme Aat U a 37X pendant 1 heure, puis dephosphoryle par la 
phosphatase alcaline de crevette (Boehringer Mannheim, Meylan France). Les enzymes 
sont inactivees a 65°C pendant 15 minutes. 

La ligation est realiste avec un rapport molaire vecteur/ insert 
d'ADN viral de 1/1 soit 50 ng de vecteur et 100 ng d'insert d'ADN viral, prepares 
25 comme decrits ci-dessus, a I'aide de 1 U de ligase T4 (Life Technologies, France) k 24 
°C pendant 16 heures. Apres dilution au 1/2, le produit de ligation est chaufie a 65°C 
pour mactiver la ligase T4 puis refroidi sur de la glace. Des bacteries electro- 
competentes Sure® (Stratagene, Heidelberg Allemagne) sont electroporees avec 2 ou 
4 nl de cette solution de ligation (1500 V, 50 fiF, 200 £2) puis mises a incuber avec 
30 1 ml de milieu SOC (Life Technologies. France) pendant 1 heure avant d'etre etalees 
sur un milieu gelose Luria Broth (Life Technologies, France) contenant 100 ng/ml 
d'amoxycilline, 15 ng/ml de tetracycline, 100 ng/ml d'IPTG et 50 ng/ml de X-gal. 
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Vingt quatre colonies blanches (recombinantes) ont ete selection- 
nees ; leur plasmide est extrait par minipreparation d'ADN et une carte de restriction 
sommaire (Aat II, Aat II + BamH I, BamH I, BamH I + Bgl 11, Hind II) a permis de 
selectionner 2 clones recombinants avec un insert de taille et de carte de restriction 
5 compatibles avec un insert d'ADN viral V9. 

Ces 2 clones (2 et 22) ont ete sequences a Taide d'un sequenceur 
automatique ABI 377 (Perkin Elmer, France) : ils contiennent bien un insert de 
5 028 pb, les 2 sequences sont identiques sauf a la position 1165 (A et G pour les 
clones 2 et 22 respectivement). La sequence directe de TADN viral V9 a permis de 
10 determiner que c'est le G en position 1 165 qui est correct, c'est done le clone 22 qui a 
ete selectionne pour etre depose a la Collection Nationale de Culture des 
Microorganismes (Institut Pasteur, Paris France) sous le n"" H940, le 18 novembre 
1997, et dont la sequence correspond a SEQ ID NO: 1 . 

Les figures 1 a 6 montrent les distances genetiques qui existent entre 
15 I'erythrovirus V9 et Terythrovirus B19. Dans ces figures, les difiFerentes sequences 
d'erythrovirus sont representees par leur mnemonique dans GeneBank (release 103.0 
d'octobre 1997). 

EXEMPLE 2 : Diagnostic d'un crythrovirus de type V9 par hybridation ADN 
(dot blot ou slot blot ou microplaque) avec une sonde specifique. 

20 UADN viral est extrait par exemple a I'aide d'une colonne QIAamp 

Blood Kit (Qiagen S.A., France) ou de tout autre procede d'extraction des acides 
nucleiques a partir d'un prelevement biologique (sang, serum, plasma, liquide amnio- 
tique, moelle osseuse, tissus). L'ADN en solution est denature a 95'*C pendant 2 
minutes puis refroidi sur de la glace, transfere sur membrane de Nylon ou d'acetate de 

25 cellulose par filtration sous vide, puis fixe (chaufFage de la membrane a 80^*0 pendant 1 
heure). La membrane est ensuite hybridee avec une sonde ADN ou ARN specifique de 
V9, telle que la sequence SEQ ID NO:l ou son complementaire ou un fi-agment de 
ceUe-ci, en particuUer les sequences SEQ ID NO:45 a SEQ ID NO:80 et 110 ou leur 
complementaire, ou un firagment de ces sequences marquees de maniere appropriee. Ce 

30 marquage pent etre un marquage avec un radio-element ( P, P, 

autre radio-isotope), un marquage firoid (biotine, marqueur fluorescent, digoxygenine 
ou tout autre molecule pouvant etre couplee ou incorporee dans un firagment d'ADN 
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ou d'ARN et pouvant etre detectee par un anticorps specifique, ou par un chelate de 
ruthenium). Dans le cas d'un marquage par un element radioactif, la revelation est 
effectuee par auto-radiographie ou tout autre precede permettant la detection de 
remission du radio-isotope (tel que le Phosphorimager, Molecular Dynamics, 
5 Bondoufle. France). Dans le cas d'un marquage a la biotine, la revelation est effectuee a 
I'aide d'un conjugue enzyme/streptavidine et un substrat de revelation adapte. Dans le 
cas d'un marquage fluorescent, la revelation se fait a I'aide d'un fluoro-Imager 
(Molecular Dynamics, Bondoufle. France) ou de tout autre appareU capable de detecter 
remission de fluorescence. Dans le cas d'un marquage a la digoxygenine (ou avec un 
10 autre antigene) la revelation se fait a I'aide d'un anticorps anti-digoxygenine (ou speci- 
fique de I'antigene utiUse pour le marquage), couple directement a une enzyme 
(phosphatase alcaline, peroxydase ou toute autre enzyme), ou de maniere indirecte par 
un anticorps anti-digoxygenine (ou specifique de i'antigene utilise pour le marquage) et 
un anti-anticorps couple a une enzyme. Un substrat adapte a I'enzyme du conjugue est 
15 utilise pour la revelation. Dans le cas d'un marquage par chelate de ruthenium (comme 
le TBR) la revelation s'effectue par une reaction d'electrochemiluminescence (G.F. 
Blackburn et al., Clin. Chem., 1991, 37:1534-1539). 

Une variante de cette technique comprend la fixation de I'ADN viral 
sur micro-plaque ou un autre support soiide et I'hybridation avec une sonde marquee 
20 conrnie precise ci-dessus. 

Une autre variante de cette technique comprend la fixation d'une 
sonde non marquee sur une micro-plaque ou un autre support soiide et I'hybridation 
avec I'ADN viral de I'echantillon qui aura ete prealablement marque. 
EXEMPLE 3 : Diagnostic d'un erythrovirus de type V9 par amplification 
25 genique (PCR ou polymerase chain reaction) et hybridation : 

On extrait de I'ADN viral a partir d'un echantillon biologique (sang, 
serum, plasma, liquide amniotique, moeUe osseuse, tissus), a I'aide d'une colonne 
QIAamp Blood Kit (Qiagen S.A., France) ou de tout autre precede d'extraction des 
acides nucleiques. 

^° La PCR est realisee selon la methode decrite par Saiki et al. (Nature, 

1986, 324:163-62) avec 10 jil de solution d'ADN dans un volume final de 100 pi de 
melange reactionnel (50 mM KCl ; 10 mM Tris-HCl pH 8,3 ; 2.5 mM MgCh; 200 
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dNTP; 25 pmoles d*oligonucleotides sens et anti-sens) avec 1,5 UI d'AmpliTaq Gold ™ 
(Perkin Elmer, France). Les amorces d'amplification sont des oligonucleotides de 20 a 
25 mers choisis pour n*amplifier que I'ADN du variant V9 : soit les 2 amorces (sens et 
anti-sens) sont des fragments des sequences specifiques du V9 (SEQ ID NO:45 a 80, 

5 108 et 110) ou leurs complementaires, soit Tune des amorces est choisie parmi ces 
sequences specifiques du V9 (SEQ ID NO:45-80, 108 et 110) ou leurs complemen- 
taires tandis que I'autre amorce est choisie parmi les sequences aptes a hybrider aussi 
bien les erythrovinis B19 que les erythrovirus V9 (SEQ ID NO:2 a 44, 105-107, 109 et 
111-112) ou leurs complementaires. Les cycles de temperatures sont imposes au 

10 melange reactionnel par un thermocycleur (T9600, Perkin Elmer, France) selon le 
programme suivant : 

1 cycle : 

- 6 minutes a 95°C 
5 cycles : 

15 - 60 secondes a 95°C 

- 30 secondes a 60°C 

- 30 secondes a 72^*0 
45 cycles : 

- 30 secondes a 95''C 
20 - 30 secondes a 60°C 

- 30 secondes a 72*'C 
1 cycle : 

- 5 minutes a 72*'C 

Le produit d*amplification est depose sur un gel d'agarose a 1,3 % 
25 pour subir une separation electrophoretique et un transfert sur une membrane de Nylon 
chargee par capillarite selon une technique classique (Sambrook J. et al., 1989, 
Molecular Cloning: A Laboratory Manual Cold Spring Harbor Laboratory Press, 
Cold Spring Harbor), 

La sonde est un oligonucleotide de 20-30 mers, fragment d'une 
30 sequence specifique du V9 (SEQ ID NO:45 a 80, 108 et 110) ou leurs complemen- 
taires, EUe est marquee en 3' par du DIG-dUTP a Taide du kit DIG Oligonucleotide 
Tailing (Boehringer Mannheim, Meylan, France). 
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La membrane de transfert est prehybridee dans un tampon compre- 
nant (50 % formamide ; 5X SSC ; 2 % de reactif de blocage (Boehringer MamAeim. 
Meylan, France) ; 0,1 % de N-Iauryl sarcosine ; 0.02 % de SDS), a 42X pendant 90 
minutes. L'hybridation est realisee dans 3 ml d'un tampon de meme composition avec 
10 Hi de sonde marquee a 42°C pendant 16 heures. La membrane est lavee 2 fois en 
tampon 2X SSC; 0.1 % SDS a 60°C pendant 10 minutes, puis 2 fois en tampon IX 
SSC ; 0.1 % SDS a 60°C pendant 10 minutes. La membrane est ensuite revelee avec le 
DIG Luminescent Detection Kit (Boehringer Mannheim, Meylan, France) et une auto- 
radiographic. 

EXEMPLE 4 : Diagnostic de groupe et diagnostic differentiel des erythrovirus de 
type B19 et V9 par amplification genlque et hybridation: 

On extrait de I'ADN viral a partir d'un echantillon biologique (sang, 
seium, plasma, liquide amniotique, moeUe osseuse, tissus) a I'aide d'une colonne 
QIAamp Blood Kit (Qiagen S.A., France) ou de tout autre procede d'extraction des 
15 acides nucleiques. 

LaPCR est realisee selon la methode decrite par Saiki et al. (Nature, 
1986, precite) avec 10 ^1 de la solution d'ADN dans un volume final de 100 pi de 
melange reactionnel (50 mMKCl ; 10 mM Tris-HCl pH 8,3 ; 2,5 mM MgCb ; 200 |iM 
dNTP ; 25 pmoles d'oligonucleotides sens et anti-sens) avec 1.5 UI d'AmpIiTaq Gold™ 
(Perkin Elmer, France). Les amorces d'ampUfication sont des oligonucleotides de 20 a 
25 mers choisis pour ampUfier I'ADN du B19 et du variant V9 : les 2 amorces (sens et 
anti-sens) sont des fragments des sequences aptes a s'hybrider aussi bien avec les ery- 
throvirus B19 qu'avec les erythrovirus V9 (SEQ ID NO:2 a 44, 105-107. 109, Hi- 
ll 2) ou de leurs complementaires. Les cycles de temperatures sont imposes au 
melange reactionnel par un thennocycleur (T9600. Perkin Ebner, France) selon le 
programme suivant : 

1 cycle : 

- 6 minutes a 95**C 
5 cycles : 

30 - 60 secondes a 95°C 

- 30 secondes a eO'C 

- 30 secondes a 72°C 
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45 cycles : 

- 30 secondes a PS'C 

- 30 secondes a 60''C 

- 30 secondes a 72''C 
5 1 cycle : 

- 5 minutes i IT'C 

Le produit d'amplification est depose sur un gel d'agarose a 1.3% 
pour subir une separation electrophoritique et un transfert sur une membrane de Nylon 
chargee par capiUarite selon une technique classique (J. Sambrook et al.. 1989. 
10 precite). 

La sonde est un oUgonucl6otide de 20-30 mers. fragment d-une 
sequence specifique du V9 (SEQ ID NO.45-80. 108 et 110) ou de leurs complemen- 
taires. ou bien specifique du B19, ou enfin qui s'hybride aussi aux B19 qu'aux V9 
(SEQ IDNO:2a44ou 105-107. 109. 111-112), si on cherche a reaUser un diagnostic 
15 de groupe. EUe est marquee en 3' par du DIG-dUTP a I'aide du kit DIG 
oligonucleotide tailing CBoehringer Mannheim, Meylan, France). 

La membrane de transfert est prehybridee et hybridee dans les mSmes 
conditions que ceUes exppsees a ^exe^^>le 3. 

FXFMPLES : Diagnostic de groupe et diagnostic diffcrentiel des fiiythrovirus de 
20 type B19 et V9 par amplification ginique et enzymes de restriction. 

Extraction de I'ADN viral a partir dVn echantillon biologique (sang, 
serum, plasma, Uquide amniotique, moeUe osseuse. tissus) a I'aide dHme colonne 
QIAamp Blood Kit (Qiagen S.A.. France) ou de tout autre proced6 d'extraction des 
acides nucleiques. 

25 La PGR est reaUsee selon la methode decrite par Saiki et al. (Nature, 

1986, precite) avec 10 jil de la solution d'ADN dans un volume final de 100 ^l de 
mela^e reactionnel (50 mM KCl ; 10 mM Tris-HCl pH 8,3 ; 2,5 mM MgCb ; 200 jiM 
dNTP ; 25 pmoles d'oUgonucleotides sens et anti-sens) avec 1,5 UI d'AmpUTaq Gold™ 
(Perkiil Elmer, France). Les amorces d'amplification sont des oUgonucleotides de 20 i 

30 25 mers choisis pour amplifier I'ADN du B19 et du variant V9 : les 2 amorces (sens et 
anti-sens) sont des fragments des sequences aptes a hybrider aussi bien rerythrovinis 
B19 que I'^rythrovirus V9 (SEQ ID N0:2 4 44 ou 105-107. 109, 111-112) ou leurs 
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complementaires. par exemple avec la paire d'amorces B. Les cycles de temperatures 
sont imposes au melange reactionnel par un themiocycleur (T9600, Perkin Elmer, 
France) selon le programme suivant : 

_ . 1 cycle : - - - - . _ . 

5 - 6 minutes i 95°C 

5 (^cles : 

- 60 secondes a 95°C 

- 30 secondes k eo^C 

- 30 secondes a 72°C 
10 45 cycles : 

- 30 secondes a 95°C 

- 30 secondes a 60°C 

- 30 secondes a 72°C 
1 <^cle : 

15 - 5 minutes a ll^C 

Un aUquot du produit d'amplification (10 pi) est soumis a Taction de 
I'enzyme de restriction Bgl n. un autre aUquot (10 fil) est soumis a I'enzyme de restric- 
tion Mun I. Ces 2 aliquots ainsi que 10 m1 du produit d'amplification n'ayant pas subi 
Taction des enzymes de restriction sont deposes sur un gel d'agarose k 1,3 % pour subir 

20 une separation electrophoretique selon une technique classique (J. Sambrook et al., 
1989. pr6cit6). Le diagnostic d'erythroviius B19 ou V9 est obtenu selon que le produit 
d'ampUfication est clive par Mun I ou Bgl n, respectivement. 

Ainsi que cela ressort de ce qui precede, I'invention ne se limite 
nullement a ceux de ses modes de raise en oeuvre, de realisation et d'appUcation qui 

25 viennent d'etre decrits de fapon plus explicite ; elle en embrasse au contraire toutes les 
variantes qui peuvent venir a I'esprit du technicien en la matiere, sans s'ecarter du 
cadre, ni de la portee, de la presente invention. 
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LISTE DE SBQUENCE3 



(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: ASSISTANCE PUBLIQUE-HOPITAUX DE PARIS 

(B) RUE: 3 AVENUE VICTORIA 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75004 

(ii) TITRE DE L' INVENTION: ERYTHROVIRUS HUMAIN, FRAGMENTS DUDIT VIRUS 
AINSI QUE LEURS APPLICATIONS. 

(iii) NOMBRE DE SEQUENCES: 112 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGXCIEL: Patentin Release #1.0, Version #1.30 (OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 5028 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 
GACGTCACAG GAAATGACGT AACTGTCCGC CATCTTGTAC CGGAAGTCCC GCCTACCGGC 
GGCGACCGGC GGCATCTGAT TTGGTGTCTT CTTTTTGAAA TTTTGGCGGG CTTTTTCCCG 
CCTTATGCAA ATAAGCGGCC ATGTTTAATG TTATATTTTA ATTTAATTGG ACAAACGCCT 
AACGGTTACT AGGGGCGGAG TTACGGGCGG TATATAAGCA GCTGCGTTCC CTGACACTTT 
CTTTTCTGGT TGCTTTTGAC TGGAACTCAC TTGCTGTTCT TTGCCTGCTA AGTAACAGGT 
ATTTATACTA ACTTTTAATT TACTAACATG GAGCTATTTC GGGGTGTCTT GCACATTTCC 
TCTAACATTC TGGACTGTGC TAATGATAAC TGGTGGTGCT CTATGCTAGA CTTAGATACT 
TCTGACTGGG AACCACTAAC CCATTCTAAC AGATTAATGG CAATATATTT AAGCAGTGTT 
GCTTCTAAAC TTGATTTTAC TGGGGGGCCG CTAGCAGGTT GCTTATACTT TTTTCAGGTG 
GAATGTAACA AATTTGAGGA AGGCTATCAT ATCCATGTAG TTATTGGTGG TCCAGGACTA 
AATGCTAGAA ACTTAACTGT GTGCGTAGAA GGTTTATTTA ATAATGTTCT TTACCATCTT 
GTAACTGAAA GTGTTAAACT TAAATTTTTG CCAGGGATGA CTACCAAAGG AAAATATTTT 
AGAGATGGAG AGCAGTTTAT AGAAAATTAC TTAATGAAAA AAATTCCTTT AAATGTTGTG 
TGGTGTGTAA CAAATATTGA CGGGTATATA GACACCTGTA TTTCCGCCTC TTTTCGGCGA 
GGAGCTTGTC ATGCTAAAAG ACCCCGCATT ACTGCAAATA CAGACAGTGC TACTAATGAA 
ACTGGGGAGT CTAGCTGTGG AGGGGGAGAT GTTGTGCCAT TCGCTGGAAA GGGAACAAAA 
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GCGGGGTTAA AGTTTCAAAC CATGGTAAAT TGGCTATGTG AAAACAGAGT ATTTACTGAA 
GATAAATGGA AATTAGTGGA TTTTAACCAA TATACTTTAT TAAGTAGCAG TCACAGTGGC 
AGCTTTCAAA TTCAAAGTGC CTTAAAGTTA GCTATTTATA AAGCTACTAA CTTAGTACCC 
ACTAGTACAT TCTTGTTACA TTCAGACTTT GAGCAGGTTA CTTGCATTAA AGAAAATAAA 
ATAGTAAAAT TATTATTGTG TCAAAACTAT GATCCTCTTT TAGTGGGTCA ACATGTGTTA 
AGGTGGATTG ACAAAAAATG TGGTAAAAAA AACACCCTGT GGTTTTACGG GCCACCAAGT 
■ ACTGGAAAAA CAAATTTGGC AATGGCTATT GCTAAAACTG TACCAGTGTA TGGAATGGTG 
AATTGGAATA ATGAAAACTT TCCATTTAAT GATGTAGCGG GGAAAAGTTT GGTGGTCTGG 
GATGAAGGCA TTATTAAGTC CACTATTGTG GAAGCTGCAA AAGCCATTTT AGGTGGTCAG 
CCAACCAGGG TAGATCAGAA AATGCGTGGC AGTGTGGCAG TGCCCGGTGT GCCTGTGGTT 
ATAACCAGCA ATGGTGACAT TACATTTGTT GTGAGTGGTA ATACCACTAC AACTGTGCAT 
GCTAAAGCCT TAAAGGAACG GATGGTAAAG CTAAACTTTA CCATAAGATG TAGCCCTGAC 
ATGGGTTTAC TTACAGAGGC TGATGTACAA CAATGGCTAA CTTGGTGTAA TGCACAAAGC 
TGGAGCCACT ATGAAAACTG GGCAATAAAC TACACATTTG ATTTQCCTGG AATAAATGCA 
GATGCCCTCC ACCCAGATCT CCAAACCACC CCCATTGTCC CAGACACCAG TATCAGCAGC 
AGTGGTGGTG AAAGCTCTGA AGAACTCAGT GAAAGCAGCT TTTTCAACCT CATCACTCCA 
GGCGCCTGGA ACAGTGAAAC CCCGCGCTCT AGTACGCCCG TCCCCGGGAC CAGTTCAGGA 
GAATCATTTG TCGGAAGCCC AGTTTCCTCC GAAGTGGTAG CCGCGTCGTG 6GAGGAAGCT 
TTTTACACGC CGCTTGCCGA TCAGTTTCGT GAACTGTTAG TAGGGGTTGA CTTTGTATGG 
GATGGTGTGA GGGGATTGCC TGTTTGCTGT GTGGAACATA TAAACAACAG TGGGGGAGGG 
TTGGGGCTTT GCCCTCATTG TATTAATGTG GGAGCTTGGT ATAATGGATG GAAATTTAGA 
GAGTTTACTC CAGACTTAGT GCGCTGCAGT TGTCATGTAG GAGCCTCTAA CCCATTTTCT 
GTGTTAACTT GTAAAAAATG TGCTTACCTG TCTGGATTAC AAAGTTTTGT AGATTATGAG 
TAAAACCACT AACAAATGGT GGGAAAGCAG TGACAAATTT GCCCAGGACG TGTATAAGCA 
GTTTGTGCAA TTTTATGAAA AAGCTACTGG AACAGACTTA GAGCTTATTC AAATTTTAAA 
AGACCATTAC AACATTTCTT TAGATAATCC TTTAGAAAAC CCCTCTTCTT TATTTGACTT 
AGTTGCTCGC ATTAAAAGTA ATCTTAAAAA CTCTCCAGAC CTATATAGTC ATCATTTTCA 
GAGCCATGGA CAGTTATCTG ACCACCCCCA TGCCTTATCA TCCAGTAACA GTAGTGCAGA 
ACCTAGAGGA GAAAATGCAG TATTATCTAG TGAAGACTTA CACAAGCCTG GGCAAGTTAG 
CATACAATTA CCCGGTACTA ACTATGTTGG GCCTGGCAAT GAGCTACAAG CTGGGCCTCC 
GCAGAATGCT GTGGACAGTG CTGCAAGGAT TCATGACTTT AGGTATAGCC AATTGGCTAA 
GTTGGGAATA AATCCTTATA CACATTGGAC GGTAGCAGAT GAAGAATTGT TAAAAAATAT 
AAAAAATGAA ACAGGGTTTC AAGCACAAGC AGTAAAAGAT TACTTTACTT TAAAAGGTGC 
AGCTGCCCCT GTGGCCCATT TTCAAGGAAG TTTACCGGAA GT6CCCGCGT ACAACGCCTC 
AGAAAAATAC CCCAGCATGA CTTCAGTTAA CTCTGCAGAA GCCAGCACTG GTGCAGGCGG 
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GGGAGGTAGC 
TGTAACGTGT 
AGTGTTCTCT 
CACTATTAGT 
AAATTTGTTT 
TCCAGATGCT 
AGGAGGAGGT 
TGAGTATAAA 
CATTTGGGTT 
AGGAATTTCA 
GCACAGTTCA 
AGCTGTGCCC 
TTTGTACGGT 
ATTGACACAC 
TTCAGTGTCT 
GCTTAGTACT 
GCCATACCAT 
ACAAACCACT 
AAATGAAAAA 
TAAAGGAACC 
GAACAGAAGA 
CAGTTTTAAA 
AATATTTTTA 
TACTACTTTA 
ACCTCGAAAG 
TGGTCATTTA 
ACACGGATAT 
AACATTCCCC 
GATTATATGT 
TAGAATATAA 
ATATGTACAC 
TTTAAAAATT 
GACTTCCGGT 



AACCCTACAA 
ACATTCTCTA 
CCAGCAGCTA 
CCCATTATGG 
TTCTCACCAT 
TTAACTGTAA 
GTGCAAGTTA 
TACCCATATG 
TACTTTCCCC 
GGAGACAGCA 
TTTGAACTTT 
CCAGAAAACC 
TCTCGTTTAG 
GAAGACCACG 
ACCAAAGAAG 
GGCACTAGCC 
CACTGGGACA 
TATGGAAATG 
GAACAGCTTA 
CAACAATACA 
GCTCTTCACT 
ACTCAATTTG 
AAAATACTAC 
GTTCAATATG 
GCTACTGGAA 
CCATATGTAC 
GAAAAGCCTG 
ACCGTGTCCT 
GCCCCCTCCA 
ATTATTAACT 
AAGTTTGGAA 
TCAAAAAGAA 
ACAAGATGGC 



AAAGCATGTG 
GGCAATTTTT 
GTAGCTGCCA 
GGTACTCTAC 
TAGAGTTTCA 
CTATTTCAGA 
CTGACAGCAC 
TGCTAGGTCA 
CCCAGTATGC 
AAAAATtGGC 
TGGGTACAGG 
TAGAAGGCTG 
GGGTACCTGA 
CAATTCAGCC 
GAGACAATTC 
AAAACACCAG 
CTGATAAATA 
CTGAGGACAA 
AGCAGTTACA 
CAGACCAAAT 
ATGAAAGTCA 
CAGCCCTAGG 
CACAAAGTGG 
CTGTGGGAAT 
GGTGGAATCC 
TGTATGACCC 
AAGAATTGTG 
CAGCCAGGAA 
ATACCCCGTA 
AGATATGAAC 
AAATAAAAGC 
GACACCAAAT 
GGACAGTTAC 



GAGTGAAGGG 
AATTCCATAT 
CAATGCTAGT 
TCCGTGGAGA 
GCACTTAATT 
AATTGCTGTA 
CACAGGACGT 
GGGACAAGAC 
TTACTTAACA 
TAGTGAAGAA 
GGGATCTGCC 
CAGCCAACAT 
CACATTAGGA 
ACAAAACTTT 
TAATACAGGT 
AATTTCCCTA 
TGTTACAGGA 
AGAGTATCAG 
AGGTCTTAAC 
TGAACGCCCT 
GCTGTGGAGT 
CGGGTGGGGT 
GCCAATTGGA 
AATGACAGTT 
CCAGCCTGGC 
CACAGCTACA 
GACTGCCAAA 
CCGTCACCCA 
GGCAACCATC 
AACATGTAAT 
CTTAAATAAA 
CAGATGCCGC 
GTCATTTCCT 



GCTACATTTA 
GATCCAGAGC 
GGGAAAGAGG 
TACTTAGATT 
GAAAATTATG 
AAAGATGTCA 
TTGTGTATGT 
ACACTAGCTC 
GTAGGTGAAG 
TCAGCTTTTT 
ACTATGTCCT 
TTTTATGAAA 
GGGGACCCTA 
ATGCCTGGGC 
GCTGGAAAAG 
CGCCCCGGGC 
ATAAATGCCA 
CAAGGGGTAG 
ATGCACACAT 
CTTATGGTGG 
AAAATCCCTA 
TTGCATCAAC 
GGTATTAAAT 
ACCATGACCT 
GTTTATCCTC 
GATGCAAAGC 
AGCCGTGTGC 
CCGCCCACCT 
TATAAAAGAT 
TAGAATGCTA 
TAATTCATAG 
CGGTCGCCGC 
GTGACGTC 



CTGCTAATTC 
ATCATTATAA 
CAAAAGTGTG 
TTAATGCTTT 
GTAGTATAGC 
CAGACAAAAC 
TAGTGGATCA 
CAGAACTGCC 
TAAACACACA 
ATGTGTTAGA 
ACAAATTTCC 
TGTACAACCC 
AATTTAGATC 
CACTAATAAA 
CCCTTACGGG 
CAGTATCTCA 
TTTCACATGG 
GAAGATTTCC 
ACTTCCCTAA 
GCTCTGTTTG 
ACTTAGATGA 
CACCCCCTCA 
CCATGGGAAT 
TTAAATTGGG 
CTCATGCAGC 
AACACCACAG 
ACCCATTGTA 
GTGCCGCCCA 
ACAGACGCTG 
AGATTATGTA 
TGTATGGTTC 
CGGTAGGCGG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

-(ii) TYPE DE MOLECULE: Autre acide nucleioue 
(A) DESCRIPTION: /desc = "AMORCE" 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 
ACTTCTGACT GGGAACCACT AAC 
(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 29 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleioue 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
TTTAGAGATG GAGAGCAGTT TATAGAAAA 
(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
TGGAATAATG AAAACTTTCC ATTTAATGAT GTAGC 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE " 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
TTGGTGGTCT GGGATGAAGG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleigue 
(A) DESCRIPTION: /desc = "AMORCE" 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
ACAGAGGCTG ATGTACAACA 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 
TGGTGTAATG CACAAAGCTG G 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8 
CCACTATGAA AACTGGGCAA TAAACTACAC A 
(2) INFORMATIONS POUR LA SEQ ID NO : 9 : 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9 
TTTGATTTCC CTGGAAT 

(2) INFORMATIONS POUR LA SEQ ID NO : 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 



24 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lindaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE- 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
AATGCAGATG CCCTCCACCC AGA 
(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 64 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
CAGACACCAG TATCAGCAGC AGTGGTGGTG AAAGCTCTGA AGAACTCAGT GAAAGCAGCT 
TTTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
TGAAACCCCG CGCTCTAGTA CGCCC 
(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 55 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBPIE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
TCCCCGGGAC CAGTTCAGGA GAATCATTTG TCGGAAGCCC AGTTTCCTCC GAAGT 
(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: Autre acide nucleique 
<A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
CAGTTTCGTG AACTGTTAGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleicjue 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15 
GCTTGGTATA ATGGATG<5AA ATTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleicjue 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16 
AAAAAATGTG CTTACCTGTC TGGATT 
(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17 
CTTAAAAACT CTCCAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 
TATATAGTCA TCATTTTCA 

19 

(2) INFORMATIONS POUR LA SEQ ID NO : 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 43 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION; /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 
CATGGACAGT TATCTGACCA CCCCCATGCC TTATCATCCA GTA 
(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 
TGCAGAACCT AGAGGAGAA 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 47 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
ATGCAGTATT ATCTAGTGAA GACTTACACA AGCCTGGGCA AGTTAGC 
(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 49 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
TACCCGGTAC TAACTATGTT GGGCCTGGCA ATGAGCTACA AGCTGGGCC 



49 
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(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 39 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
GACAGTGCTG CAAGGATTCA TGACTTTAGG TATAGCCAA 
(2) INFORMATIONS POtm LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: . 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
TGGCTAAGTT GGGAATAAAT CC 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 
TTAAAAAATA TAAAAAATGA AAC 
(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 53 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
TACTTTACTT TAAAAGGTGC AGCTGCCCCT GTGGCCCATT TTCAAGGAAG TTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGtTEUR; 23 paires de bases 

(B) TYPE: nucleotide 
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(C) MOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27 
TACAACGCCT CAGAAAAATA CCC 
(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
TCTGCAGAAG CCA(5CACTGG T(3CAGG 
(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 
TTAGATTTTA ATGCTTTAAA TTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 
TTAGAGTTTC AGCACTTAAT TGAAAATTAT GG 
(2) INFORMATIONS POUR LA SEQ ID NO : 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 
ACAGGAATAA ATGCCATTTC 

(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nuclSique 
(A) DESCRIPTION: /desc = 'MSOKCZ* 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
GACAAAGAGT ATCAGCAAGG GGTA 
(2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: sinqple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = "AMORCE* 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 
AGATTTCCAA ATGAAAAAGA ACAGCT 
(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRIMS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucieique 
(A) DESCRIPTION: /dosc « "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34 
TC AGCTGTGG AGTAAAAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE' DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nuciei<iue 
(A) DESCRIPTION: /desc = "AMQRCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID MO: 35 
TTAGATGACA GTTTTAAAAC TCA 



30 



(2) INFORMATIONS POUR LA SEQ ID NO: 36: 

(i) CARACTERI STIQ OES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucltotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc « "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 
CCTCAAATAT TTTTAAAAAT A 'JB- 
(2) INFORMATIONS POUR LA SEQ ID «Pp: 37- 

(i) CARACTE RISTIQ UES DE lA SE^^ 

(A) LONGUEUR: 34 paireir|de bases 

(B) TYPE: nucl^tide%^tp- 

(C) NOMBRE DE BRINS: tsilpitt 

(D) CONFIGURATION: lin^ire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc m "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 
TACCACAAAG TGGGCCAATT GGAGGTATTA AATC 
(2) INFORMATIONS POUR LA SEQ ID NO: 36: 
(i) 



CARACTE RISTIQ UES DE LA isSQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: rmcl^otide^^^ii*^.^ 

(C) NOMBRE DE BRINS -Islaiple 

(D) CONFIGURATION: lin^re 



(ii) 



(xi) 



TYPE DE MOLECULE . , 

(A) DESCRIPTIC^t^/dlgi 



i AMORCE* 
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(i) 



38: :.<m 



(ii) 



CARACTERISTIQUisl^ 

: •■'^(Al ^LONGUEUR:^'5S2fi^t^1 

(B) TYPE: mici*oti.aS^^ 

(C) NOMBRE DE BRmsWiL^^^^ 

(D) CONFIGURATIiSrlpllSiiMl^^ 

TYPE,;PE, *«^»*BCULB|lpg^» 




(xi) DESCRIPTION DE lA^^^UH^^ ID NO: 39: 

G<mymrrAc CATATGTACT gtaQ^^^^ctacag atgcaaagca'ac^^^^ 



■'mm 



Mi 




29 



30 



31 

(2) INFORKATIONS POUR LA SEQ ID NO: 40: 

(i) CARACTERISTIQUES DE lA SEQUENCE: 

(A) LONGUEUR: 29 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS ; simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
(A) DESCRIPTION: /desc = "AMORCE" 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40: 
GGATATGAAA AGCCTGAAGA ATTGTGGAC 
(2) INFORMATIONS POUR LA SEQ ID NO: 41: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEtni: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = -AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41: 
GCCAAAAGCC GTGTGCACCC ATTGTAAACA 
(2) INFORMATIONS POUR LA SEQ ID NO : 42: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGUPLATION : lineaire 

(ii) TYPE DE MOLECULE: Autre acide hucleique 

(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42: 
TCCCCACCGT gtcctcagcc a 
(2) INFORMATIONS POUR LA SEQ ID NO: 43: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 109 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 43: 
CTTTAAAAAT TTCAAAAAGA AGACACCAAA TCAGATGCCG CCGGTCGCCG CCGGTAGGCG 60 
GGACTTCCGG TACAAGATGG CGGACAGTTA CGTCATTTCC TGTGACGTC 
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(2) INFORMATIONS POUR XA SEQ ID NO: 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 103 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: Unfair e 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = " Amorce - 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 44: 
GACGTCACAG GAAATGACGT AACTGTCCGC CATCTTGTAC CGGAAGTCCC GCCTACCGGC 60 
GGCGACCGGC GGCATCTGAT TTGGTGTCTT CTTTTTGAAA TTT 103 
(2) INFORMATIONS POUR LA SEQ ID NO: 45: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 210 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "Sonde" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45: 
CTTTTTGAAA TTTTGGCGGG CTTTTTCCCG CCTTATGCAA ATAAGCGGCC ATGTTTAATG 60 
TTATATTTTA ATTTAATTGG ACAAACGCCT AACGGTTACT AGGGGCGGAG TTACGGGCGG 120 
TATATAAGCA GCTGCGTTCC CTGACACTTT CTTTTCTGGT TGCTTTTGAC TGGAACTCAC 180 
TTGCTGTTCT TTGCCTGCTA AGTAACAGGT 
(2) INFORMATIONS POUR LA SEQ ID NO : 46: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46: 
ATTTATACTA ACTTTTAATT TACTAACATG 
(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 100 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 47.: 



GAGCTATTTC GGGGTGTCTT GCACATTTCC TCTAACATTC TGGACTGTGC TAATGATAAC 
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TGGTGGTGCT CTATGCTAGA CTTAGATACT TCTGACTGGG 



100 



(2) INFORMATIONS POUR LA SEQ ID NO: 48: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 117 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 48: 
AACCACTAAC CCATTCTAAC AGATTAATGG CAATATATTT AAGCAGTGTT GCTTCTAAAC 
TTGATTTTAC TGGGGGGCCG CTAGCAGGTT GCTTATACTT TTTTCAGGTG GAATGTA 
(2) INFORMATIONS POUR LA SEQ ID NO: 49: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 183 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
<A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49: 
ACAAATTTGA GGAAGGCTAT CATATCCATG TAGTTATTGG TGGTCCAGGA CTAAATGCTA 
GAAACTTAAC TGTGTGCGTA GAAGGTTTAT TTAATAATGT TCTTTACCAT CTTGTAACTG 
AAAGTGTTAA ACTTAAATTT TTGCCAGGGA TGACTACCAA AGGAAAATAT TTTAGAGATG 
GAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 50: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 670 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50: 
AGCAGTTTAT AGAAAATTAC TTAATGAAAA AAATTCCTTT AAATGTTGTG TGGTGTGTAA 
CAAATATTGA CGGGTATATA GACACCTGTA TTTCCGCCTC TTTTCGGCGA GGAGCTTGTC 
ATGCTAAAAG ACCCCGCATT ACTGCAAATA CAGACAGTGC TACTAATGAA ACTGGGGAGT 
CTAGCTGTGG AGGGGGAGAT GTTGTGCCAT TCGCTGGAAA GGGAACAAAA GCGGGGTTAA 
AGTTTCAAAC CATGGTAAAT TGGCTATGTG AAAACAGAGT ATTTACTGAA GATAAATGGA 
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AATTAGTGGA TTTTAACCAA TATACTTTAT TAAGTAGCAG TCACAGTGGC AGCTTTCAAA 
TTCAAAGTGC CTTAAAGTTA GCTATTTATA AAGCTACTAA CTTAGTACCC ACTAGTACAT 
TCTTGTTACA TTCAGACTTT GAGCAGGTTA CTTGCATTAA AGAAAATAAA ATAGTAAAAT 
TATTATTGTG TCAAAACTAT GATCCTCTTT TAGTGGGTCA ACATGTGTTA AGGTGGATTG" 
ACAAAAAATG TGGTAAAAAA AACACCCTGT GGTTTTACGG GCCACCAAGT ACTGGAAAAA 
CAAATTTGGC AATGGCTATT GCTAAAACTG TACCAGTGTA TGGAATGGTG AATTGGAATA 
ATGAAAACTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 51: 
TCCATTTAAT GATGTAGCGG GGAAAAGTTT GGTGGT 
(2) INFORMATIONS POUR LA SEQ ID NO: 52: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 46 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 52: 
CTGGGATGAA GGCATTATTA AGTCCACTAT TGTGGAAGCT GCAAAA 
(2) INFORMATIONS POUR LA SEQ ID NO: 53: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 84 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53: 
GCCATTTTAG GTGGTCAGCC AACCAGGGTA GATCAGAAAA TGCGTGGCAG TGTGGCAGTG 
CCCGGTGTGC CTGTGGTTAT AACC 
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<2) INFORMATIONS POUR LA SEQ ID NO: 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 60 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lindaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
(A) DESCRIPTION: /desc = "SONDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54: 
AGCAATGGTG ACATTACATT TGTTGTGAGT GGTAATACCA CTACAACTGT GCATGCTAAA 

(2) INFORMATIONS POUR LA SEQ ID NO: 55: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 76 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "SONDE- 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 55: 
GCCTTAAAGG AACGGATGGT AAAGCTAAAC TTTACCATAA GATGTAGCCC TGACATGGGT 
TTACTTACAG AGGCTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(i) CARACTERISTIQXJES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = * SONDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 56: 
ATGTACAACA ATGGCTAACT TGGTGTAATG 
(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 28 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

( D ) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "SONDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 57: 
CACAAAGCTG GAGCCACTAT GAAAACTG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGXmUR: 98 paires de bases 

(B) TYPE: nucleotide 

.(C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire. 

(ii) TYPE DE MOLECULE: Autre acide nucleioue 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 58: 
TTCAGGAGAA TCATTTGTCG GAAGCCCAGT TTCCTCCGAA GTGGTAGCCG CGTCGTGGGA 
GGAAGCTTTT TACACGCCGC TTGCCGATCA GTTTCGTG 
(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 134 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = - SONDE " 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 59: 
AACTGTTAGT AGGGGTTGAC TTTGTATGGG ATGGTGTGAG GGGATTGCCT GTTTGCTGTG 
TGGAACATAT AAACAACAGT GGGGGAGGGT TGGGGCTTTG CCCTCATTGT ATTAATGTGG 
GAGCTTGGTA TAAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 100 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 
GGATGGAAAT TTAGAGAGTT TACTCCAGAC TTAGTGCGCT GCAGTTGTCA TGTAGGAGCC 
TCTAACCCAT TTTCTGTGTT AACTTGTAAA AAATGTGCTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 61: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



60 
120 
134 



60 
100 
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(xi) DESCRIPTION DE tA SEQUENCE: SEQ ID NO: 61: 



ACCTGTCTGG ATTACAAAGT TTTGTAGATT 
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(2) INFORMATIONS POUR LA SEQ ID NO: 62: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 102 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE* 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 62: 
ATGAGTAAAA CCACTAACAA ATGGTGGGAA AGCAGTGACA AATTTGCCCA GGACGTGTAT 60 
AAGCAGTTTG TGCAATTTTA TGAAAAAGCT ACTGGAACAG AC . 102 

(2) INFORMATIONS POUR LA SEQ ID NO: 63: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 114 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 63: 
TTAGAGCTTA TTCAAATTTT AAAAGACCAT TACAACATTT CTTTAGATAA TCCTTTAGAA 60 
AACCCCTCTT CTTTATTTGA CTTAGTTGCT CGCATTAAAA GTAATCTTAA AAAC 114 



(2) INFORMATIONS POUR LA SEQ ID NO: 64: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 64: . 
TCTCCAGACC TATATAGTCA TC 

(2) INFORMATIONS POUR LA SEQ ID NO: 65: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



38 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 65: 
ATTTTCAGAG CCATGGACAG TTA 
(2) INFORMATIONS POUR LA SEQ ID NO: 66: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = '•SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 66: 
ATCATCCAGT AACAGTAGTG CAGAACCTAG 
(2) INFORMATIONS POUR LA SEQ ID NO: 67: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 39 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 67: 
CAAGCTGGGC CTCCGCAGAA TGCTGTGGAC AGTGCTGCA 
(2) INFORMATIONS POUR LA SEQ ID NO: 68: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUETO: 56 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE"* 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 68: 
GGAATAAATC CTTATACACA TTGGACGGTA GCAGATGAAG AATTGTTAAA AAATAT 
(2) INFORMATIONS POUR LA SEQ ID NO: 69: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 51 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 69: 
AAAAAATGAA ACAGGGTTTC AAGCACAAGC AGTAAAAGAT TACTTTACTT T 
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(2) INFORMATIONS POUR LA SEQ ID NO: 70: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 37 paires de bases 

(B) TYPE: nucleotide 

{C) NOMBRE DE BRINS : simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 70: 
AAGGAAGTTT ACCGGAAGTG CCCGCGTACA ACGCCTC 37 
(2) INFORMATIONS POUR LA SEQ ID NO: 71: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 42 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGtJRATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = "SONDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 71: 
AGAAAAATAC CCCAGCATGA CTTCAGTTAA CTGTGCAGAA GC 42 
(2) INFORMATIONS POUR LA SEQ ID NO: 72: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 255 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 72: 
CAGCACTGGT GCAGGCGGGG GAGGTAGCAA CCCTACAAAA AGCATGTGGA GTGAAGGGGC 60 
TACATTTACT GCTAATTCTG TAACGTGTAC ATTCTCTAGG CAATTTTTAA TTCCATATGA 120 
TCCAGAGCAT CATTATAAAG TGTTCTCTCC AGCAGCTAGT AGCTGCCACA ATGCTAGTGG 180 
GAAAGAGGCA AAAGTGTGCA CTATTAGTCC CATTATGGGG TACTCTACTC CGTGGAGATA 240 
CTTAGATTTT AATGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 73: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucldique 
(A) DESCRIPTION: /desc = "SONDE" 



255 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 73: 
TTTAAATTTG TTTTTCTCAC CATTAGAGTT TCA 
(2) INFORMATIONS POUR LA SEQ ID NO: 74: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 725 -paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 74: 
GAAAATTATG GTAGTATAGC TCCAGATGCT TTAACTGTAA CTATTTCAGA AATTGCTGTA 
AAAGATGTCA CAGACAAAAC AGGAGGAGGT GTGCAAGTTA CTGACAGCAC CACAGGACGT 
TTGTGTATGT TAGTGGATCA TGAGTATAAA TACCCATATG TGCTAGGTCA GGGACAAGAC 
ACACTAGCTC CAGAACTGCC CATTTGGGTT TACTTTCCCC CCCAGTATGC TTACTTAACA 
GTAGGTGAAG TAAACACACA AGGAATTTCA GGAGACAGCA AAAAATTGGC TAGTGAAGAA 
TCAGCTTTTT ATGTGTTAGA GCACAGTTCA TTTGAACTTT TGGGTACAGG GGGATCTGCC 
ACTATGTCCT ACAAATTTCC AGCTGTGCCC CCAGAAAACC TAGAAGGCTG CAGCCAACAT 
TTTTATGAAA TGTACAACCC TTTGTACGGT TCTCGTTTAG GGGTACCTGA CACATTAGGA 
GGGGACCCTA AATTTAGATC ATTGACACAC GAAGACCACG CAATTCAGCC ACAAAACTTT 
ATGCCTGGGC CACTAATAAA TTCAGTGTCT ACCAAAGAAG GAGACAATTC TAATACAGGT 
GCTGGAAAAG CCCTTACGGG GCTTAGTACT GGCACTAGCC AAAACACCAG AATTTCCCTA 
CGCCCCGGGC CAGTATCTCA GCCATACCAT CACTGGGACA CTGATAAATA TGTTACAGGA 
ATAAA 

(2) INFORMATIONS POUR LA SEQ ID NO : 75: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 49 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 75: 
TGCCATTTCA CATGGACAAA CCACTTATGG AAATGCTGAG GACAAAGAG 
(2) INFORMATIONS POUR LA SEQ ID NO: 76: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 76: 
TATCAGCAAG GGGTAGGAAG ATTTCCAAAT 



(2) INFORMATIONS POUR LA SEQ ID NO: 77: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 180 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: Unfair e 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 77: 
GAAAAAGAAC AGCTTAAGCA GTTACAAGGT CTTAACATGC ACACATACTT CCCTAATAAA 
GGAACCCAAC AATACACAGA CCAAATTGAA CGCCCTCTTA TGGTGGGCTC TGTTTGGAAC 
AGAAGAGCTC TTCACTATGA AAGTCAGCTG TGGAGTAAAA TCCCTAACTT AGATGACAGT 



(2) INFORMATIONS POUR LA SEQ ID NO: 78: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 64 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 78: 
TTTAAAACTC AATTTGCAGC CCTAGGCGGG TGGGGTTTGC ATCAACCACC CCCTCAAATA 
TTTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 79: 

(i) CARACTERISTIQtJES DE LA SEQUENCE: 

(A) LONGUEUR: 152 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 



(xi) DESCRIPTION DE lA SEQUENCE: SEQ ID NO: 79: 
AGGTATTAAA TCCATGGGAA TTACTACTTT AGTTCAATAT GCTGTGGGAA TAATGACAGT 
TACCATGACC TTTAAATTGG GACCTCGAAA GGCTACTGGA AGGTGGAATC CCCAGCCTGG 
CGTTTATCCT CCTCATGCAG CTC3GTCATTT AC 



240 
260 
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(2) INFORMATIONS POUR LA SEQ ID NO : 80: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 260 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide'nucleique 
(A) DESCRIPTION: /desc = -SONDE' 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 80: 
CCCATTGTAA ACATTCCCCA CCGTGTCCTC AGCCAGGAAC CGTCACCCAC CGCCCACCTG 60 
TGCCGCCCAG ATTATATGTG CCCCCTCCAA TACCCCGTAG GCAACCATCT ATAAAAGATA 120 
CAGACGCTGT AGAATATAAA TTATTAACTA GATATGAACA ACATGTAATT AGAATGCTAA 180 
GATTATGTAA TATGTACACA AGTTTGGAAA AATAAAAGCC TTAAATAAAT AATTCATAGT 
GTATGGTTCT TTAAAAATTT 

<2) INFORMATIONS POUR LA SEQ ID NO : 81: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 2013 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: gtoe de la proteine NSl 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT :1. .2013 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 81: 

ATG GAG CTA TTT CGG GGT GTC TTG CAC ATT TCC TCT AAC ATT CTG GAC 
Met Glu Leu Phe Arg Gly Val Leu His He Ser Ser Asn He Leu Asp 

all ^! ^""^ "A GAC TTA GAT ACT TCT 

Cys Ala Asn Asp Asn Trp Trp Cys Ser Met Leu Asp Leu Asp Thr Ser 
20 25 30 

GAC TGG GAA CCA CTA ACC CAT TCT AAC AGA TTA ATG GCA ATA TAT TTA 
ASP Trp Glu Pro Leu Thr His Ser Asn Arg Leu Met Ala He Sr Leu 
-33 40 45 

stl f?"" AAA CTT GAT TTT ACT GC3G GGG CCG CTA GCA GGT 

ser Ser Val Ala Ser Lys Leu Asp Phe Thr Gly Gly Pro Leu Ala Gly 

55 60 

TGC TTA TAC TTT TTT CAG GTG GAA TGT AAC AAA TTT GAG GAA GGC TAT 240 
cys Leu Tyr Phe Phe Gin Val Glu Cys Asn Lys Phe Glu Glu Gly T^ 

70 75 ^ lo 

CAT ATC CAT GTA GTT ATT GGT GGT CCA GGA CTA AAT GOT AGA AAC TTA 
His lie Hxs Val Val He Gly Gly Pro Gly Leu Asn Ala Arg Asn tlu 

85 90 95 

ACT GTG TGC GTA GAA GGT TTA TTT AAT AAT GTT CTT TAC CAT CTT GTA -i,*: 
Thr val Cys Val Glu Gly Leu Phe Asn Asn Vai L^ ^ His L^ Val ''^ 
100 105 1X0 



48 



96 



144 



192 



288 



43 

ACT GAA AGT GTT AAA CTT AAA TTT TTG CCA GGG ATG ACT ACC AAA GGA 384 

Thr Glu Ser Val Lys Leu Lys Phe Leu Pro Gly Met Thr Thr Lys Gly 
115 120 125 

AAA TAT TTT AGA GAT GGA GAG CAG TTT ATA GAA AAT TAG TTA ATG AAA 43 2 

Lys Tyr Phe Arg Asp Gly Glu Gin Phe He Glu Asn Tyr Leu Met Lys 
130 135 140 

AAA ATT CCT TTA AAT GTT GTG TGG TGT GTA ACA AAT ATT GAC GGG TAT 480 

Lys He Pro Leu Asn Val Val Trp Cys Val Thr Asn He Asp Gly Tyr 
145 150 155 160 

ATA GAC ACC TGT ATT TCC GCC TCT TTT CGG CGA GGA GCT TGT CAT GCT 52 8 

He Asp Thr Cys He Ser Ala Ser Phe Arg Arg Gly Ala Cys His Ala 

165 170 175 

AAA AGA CCC CGC ATT ACT GCA AAT ACA GAC AGT GCT ACT AAT GAA ACT 576 

Lys Arg Pro Arg He Thr Ala Asn Thr Asp Ser Ala Thr Asn Glu Thr 
180 185 190 

GGG GAG TCT AGC TGT GGA GGG GGA GAT GTT GTG CCA TTC GCT GGA AAG 624 

Gly Glu Ser Ser Cys Gly Gly Gly Asp Val Val Pro Phe Ala Gly Lys 
195 200 205 

GGA ACA AAA GCG GGG TTA AAG TTT CAA ACC ATG GTA AAT TGG CTA TGT 672 

Gly Thr Lys Ala Gly Leu Lys Phe Gin Thr Met Val Asn Trp Leu Cys 
210 215 220 

GAA AAC AGA GTA TTT ACT GAA GAT AAA TGG AAA TTA GTG GAT TTT AAC 720 

Glu Asn Arg Val Phe Thr Glu Asp Lys Trp Lys Leu Val Asp Phe Asn 
225 230 235 240 

CAA TAT ACT TTA TTA AGT AGC AGT CAC AGT GGC AGC TTT CAA ATT CAA 76 8 

Gin Tyr Thr Leu Leu Ser Ser Ser His Ser Gly Ser Phe Gin He Gin 

245 250 255 

AGT GCC TTA AAG TTA GCT ATT TAT AAA GCT ACT AAC TTA GTA CCC ACT 816 

Ser Ala Leu Lys Leu Ala He Tyr Lys Ala Thr Asn Leu Val Pro Thr 
260 265 270 

AGT ACA TTC TTG TTA CAT TCA GAC TTT GAG CAG GTT ACT TGC ATT AAA 864 

Ser Thr Phe Leu Leu His Ser Asp Phe Glu Gin Val Thr Cys He Lys 
275 280 285 

GAA AAT AAA ATA GTA AAA TTA TTA TTG TGT CAA AAC TAT GAT CCT CTT 912 

Glu Asn Lys He Val Lys Leu Leu Leu Cys Gin Asn Tyr Asp Pro Leu 
290 295 300 

TTA GTG GGT CAA CAT GTG TTA AGG TGG ATT GAC AAA AAA TGT GGT AAA 960 

Leu Val Gly Gin His Val Leu Arg Trp He Asp Lys Lys Cys Gly Lys 
305 310 315 320 

AAA AAC ACC CTG TGG TTT TAC GGG CCA CCA AGT ACT GGA AAA ACA AAT 1008 

Lys Asn Thr Leu Trp Phe Tyr Gly Pro Pro Ser Thr Gly Lys Thr Asn 

325 330 335 

TTG GCA ATG GCT ATT GCT AAA ACT GTA CCA GTG TAT GGA ATG GTG AAT 1056 

Leu Ala Met Ala lie Ala Lys Thr Val Pro Val Tyr Gly Met Val Asn 
340 345 350 

TGG AAT AAT GAA AAC TTT CCA TTT AAT GAT GTA GCG GGG AAA AGT TTG 1104 

Trp Asn Asn Glu Asn Phe Pro Phe Asn Asp Val Ala Gly Lys Ser Leu 
355 360 365 

GTG GTC TGG GAT GAA GGC ATT ATT AAG TCC ACT ATT GTG GAA GCT GCA 1152 

Val Val Trp Asp Glu Gly He He Lys Ser Thr He Val Glu Ala Ala 
370 375 380 
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AAA GCC ATT TTA GGT GGT CAG CCA ACC AGG GTA GAT CAG AAA ATG crT 
r.ys Ala lie Leu Gly Gly Gin Pro Thr Arg Val Asp SlS ^ Met 

395 400 

GGC AGT GTG GCA GTG CCC GGT GTG CCT GTG GTT ATA ACC AGC AAT GCT 
Gly Ser Val Ala Val Pro Gly Val Pro Val Val Tli iTr JJn S 

410 415 

rr ?^ ^^"^ ^^"^ ACC ACT ACA ACT GTG CAT GCT 

Asp He Thr Phe Val Val Ser Gly Asn Thr Thr Thr Thr Val His Ala 
420 425 430 

AAA GCC TTA AAG GAA CGG ATG GTA AAG CTA AAC TTT ACC ATA AGA TGT 
Lys Ala Leu Lys Glu Arg Met Val Lys Leu Asn Phe Thr lie cjs 
^•^^ 440 445 

AGC CCT GAC ATG GGT TTA CTT ACA GAG GCT GAT GTA CAA CAA TGG CTA 
Ser Pro Asp Met Gly Leu Leu Thr Glu Ala Asp Val Gin Gin ^ Leu 

455 460 

ACT TGG TGT AAT GCA CAA AGC TGG AGC CAC TAT GAA AAC TGG GCA ATA 
Thr Trp Cys Asn Ala Gin Ser Trp Ser His Tyr Glu Asn T^ Ala lie 

470 475 480 

AAC TAG ACA TTT GAT TTC CCT GGA ATA AAT GCA GAT GCC CTC CAC CCA 
Asn Tyr Thr Phe Asp Phe Pro Gly He Asn Ala Asp Ala Leu His Pro 
485 490 495 

GAT CTC CAA ACC ACC CCC ATT GTC CCA GAC ACC AGT ATC AGC AGC AGT 
Asp Leu Gin . Thr Thr Pro He Val Pro Asp Thr Ser He Ser Ser Ser 
500 505 510 

GGT GGT GAA AGC TCT GAA GAA CTC AGT GAA AGC AGC TTT TTC AAC CTC 
Gly Gly Glu Ser Ser Glu Glu Leu Ser Glu Ser Ser Phe Phe Asn Leu 
515 520 525 

T?^ *A*= A^*^ ACC CCG CGC TCT AGT ACG CCC 

He Thr Pro Gly Ala Trp Asn Ser Glu Thr Pro Arg Ser Ser Thr Pro 
= 535 540 

vl? ^ ^^"^ e°'^ '^'^^ GAA TCA TTT GTC GGA AGC CCA GTT TCC 

Val Pro Gly Thr Ser Ser Gly Glu Ser Phe Val Gly Ser Pro Val Ser 

550 555 

TCC GAA GTG GTA GCC GCG TCG TGG GAG GAA GCT TTT TAC ACG CCG CTT 
Ser Glu Val Val Ala Ala Ser Trp Glu Glu Ala Phe Sr Thr Pro S 
565 570 575 

^"^^ GAC TTT GTA TGG GAT 

Ala Asp Gin Phe Arg Glu Leu Leu Val Gly Val Asp Phe Val Trp Asp 
580 585 590 

Gil vl? n?"" r° n"^^ """^ ^^"^ CA'^ ATA AAC AAC AGT 

Gly Val Arg Gly Leu Pro Val Cys Cys Val Glu His He Asn Asn Ser 
=55 600 605 

^ ^ ^ T° ^ "^^^ "^A^ ^^"^ ATT AAT GTG GGA GCT TGG 

Gly Gly Gly Leu Gly Leu Cys Pro His Cys He Asn Val Gly Ala Trp 

615 620 

^f* ^ ^"^"^ AGA GAG TTT ACT CCA GAC TTA GTG CGC TGC 

Tyr Asn Gly Trp Lys Phe Arg Glu Phe Thr Pro Asp Leu Val Arg Cys 

"0 635 640 

Ser Cv= wt! v*^^ f '^'^A TTT TCT GTG TTA ACT TGT AAA 

Ser Cys His Val Gly Ala Ser Asn Pro Phe Ser Val Leu Thr Cys Lys 
645 650 655 



1200 



1248 



1296 



13 44 



13 92 



1440 



1488 



1536 



1584 



1632 



1S80 



1728 



1776 



1324 



1872 



1920 



1968 
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AAA TGT GCT TAC CTG TCT GGA TTA CAA AGT TTT GTA GAT TAT GAG 2013 

Lys Cys Ala Tyr Leu Ser Gly Leu Gin Ser Phe Val Asp Tyr Glu 
660 665 670 

(2) INFORMATIONS POUR LA SEQ ID NO: 82: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 671 acides amines 

(B) TYPE: acide amin^ 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine NSl 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 82: 

Met Glu Leu Phe Arg Gly Val Leu His He Ser Ser Asn He Leu Asp 
15 10 15 

Cys Ala Asn Asp Asn Trp Trp Cys Ser Met Leu Asp Leu Asp Thr Ser 
20 25 30 

Asp Trp Glu Pro Leu Thr His Ser Asn Arg Leu Met Ala He Tyr Leu 
35 40 45 

Ser Ser Val Ala Ser Lys Leu Asp Phe Thr Gly Gly Pro Leu Ala Gly 
50 55 60 

Cys Leu Tyr Phe Phe Gin Val Glu Cys Asn Lys Phe Glu Glu Gly Tyr 
65 70 75 80 

His He His Val Val He Gly Gly Pro Gly Leu Asn Ala Arg Asn Leu 
85 90 95 

Thr Val Cys Val Glu Gly Leu Phe Asn Asn Val Leu Tyr His Leu Val 
100 105 110 

Thr Glu Ser Val Lys Leu Lys Phe Leu Pro Gly Met Thr Thr Lys Gly 
115 120 125 

Lys Tyr Phe Arg Asp Gly Glu Gin Phe He Glu Asn Tyr Leiu Met Lys 
130 135 140 

Lvs He Pro Leu Asn Val Val Trp Cys Val Thr Asn He Asp Gly Tyr 
145 150 155 160 

He Asp Thr Cys He Ser Ala Ser Phe Arg Arg Gly Ala Cys His Ala 
165 170 175 

Lvs Arg Pro Arg He Thr Ala Asn Thr Asp Ser Ala Thr Asn Glu Thr 
180 185 190 

Gly Glu Ser Ser Cys Gly Gly Gly Asp Val Val Pro Phe Ala Gly Lys 
195 200 205 

Gly Thr Lys Ala Gly Leu Lys Phe Gin Thr Met Val Asn Trp Leu Cys 
210 215 220 

Glu Asn Arg Val Phe Thr Glu Asp Lys Trp Lys Leu Val Asp Phe Asn 
225 230 235 240 

Gin Tvr Thr Leu Leu Ser Ser Ser His Ser Gly Ser Phe Gin He Gin 
245 250 255 

Ser Ala Leu Lys Leu Ala He Tyr Lys Ala Thr Asn Leu Val Pro Thr 
260 265 270 

Ser Thr Phe Leu Leu His Ser Asp Phe Glu Gin Val Thr Cys He Lys 
275 280 285 
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Glu Asn Lys He Val Lys Leu Leu Leu Cys Gin Asn IVr Asp Pro Leu 



300 



Leu val Gly Gin His Val Leu Arg Trp He Asp Lys Lys Cys Gly Lys 

310 315 

Lys Asn Thr Leu -Trp. Phe Tyr Gly -Pro Pro Ser Thr Gly Lys Thr Asn 
325 330 

Leu Ala Met Ala He Ala Lys Thr Val Pro Val Tyr Gly Met Val Asn 
J*" 345 350 

Trp Asn Asn Glu Asn Phe Pro Phe Asn Asp Val Ala Gly Lys Ser Leu 

360 365 

val val Trp Asp Glu Gly He He Lys Ser Thr He Val Glu Ala Ala 

375 380 

Lys Ala He Leu Gly Gly Gin Pro Thr Arg Val Asp Gin Lys Met Arg 

390 395 

Gly ser Val Ala Val Pro Gly Val Pro Val Val He Thr Ser Asn Gly 
^05 ' 

Asp He Thr Phe Val Val Ser Gly Asn Thr Thr Thr Thr Val His Ala 

425 430 

Lys Ala Leu Lys Glu Arg Met Val Lys Leu Asn Phe Thr He Arg Cys 

^-^^ 440 445 

ser Pro Asp Met Gly Leu Leu Thr Glu Ala Asp Val Gin Gin Trp Leu 

455 460 

Thr Trp cys Asn Ala Gin Ser Trp Ser His Tyr Glu Asn Trp Ala He 

475 480 

Asn Tyr Thr Phe Asp Phe Pro Gly He Asn Ala Asp Ala Leu His Pro 
485 490 

Asp Leu Gin Thr Thr Pro He Val Pro Asp Thr Ser He Ser Ser Ser 
=00 505 5JQ 

Gly Gly Glu Ser Ser Glu Glu Leu Ser Glu Ser Ser Phe Phe Asn Leu 
=1= 520 525 

He Thr Pro Gly Ala Trp Asn Ser Glu Thr Pro Arg Ser Ser Thr Pro 

535 

val Pro Gly Thr Ser Ser Gly Glu Ser Phe Val Gly Ser Pro Val Ser 

550 555 5gQ 

ser Glu val Val Ala Ala Ser Trp Glu Glu Ala Phe Tyr Thr Pro Leu 
=S5 570 575 

Ala Asp Gin Phe Arg Glu Leu Leu Val Gly Val Asp Phe Val Trp Asp 

585 590 

Gly Val Arg Gly Leu Pro Val Cys Cys Val Glu His He Asn Asn Ser 

600 605 

Gly Gly Gly Leu Gly Leu Cys Pro His Cys He Asn Val Gly Ala Trp 

615 Q20 

Tyr Asn Gly Trp Lys Phe Arg Glu Phe Thr Pro Asp Leu Val Arg Cys 

"0 635 ^ 640 

Ser Cys His Val Gly Ala Ser Asn Pro Phe Ser Val Leu Thr Cys Lys 

650 655 
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Lys Cys Ala Tyr Leu Ser Gly Leu Gin Ser Phe Val Asp Tyr Glu 
660 665 670 

(2) INFORMATIONS POUR LA SEQ ID NO: 83: 

(i) CARACTERISTIQUES DE LA SEQXJENCE: 

(A) LONGUEUR: 222 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lindaire 

(ii) TYPE DE MOLECULE: g^ne de la prot^ine 7,5 kDa 

( ix) CARACTERISTIQXJE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1 . .222 





(xi) 


DESCRIPTION DE 


LA SEQUENCE: 


: SEQ ID 


NO: 


83: 










ATG 
Met 


CAG 
Gin 


ATG 
Met 


CCC 
Pro 


TCC 
Ser 


ACC 
Thr 


CAG 
Gin 


ATC 
He 


TCC 
Ser 


AAA 
Lys 


CCA 
Pro 


CCC 
Pro 


CCA 
Pro 


TTG 
Leu 


TCC 
Ser 


CAG 
Gin 
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ACA 
Thr 


CCA 
Pro 


GTA 
Val 


TCA 
Ser 


GCA 
Ala 


GCA 
Ala 


GTG 
Val 


GTG 
Val 


GTG 
Val 


AAA 
Lys 


GCT 
Ala 


CTG 
Leu 


AAG 
Lys 


AAC 
Asn 


TCA 
Ser 


GTG 
Val 


96 


AAA 
Lys 


GCA 
Ala 


GCT 
Ala 


TTT 
Phe 


TCA 
Ser 


ACC 
Thr 


TCA 
Ser 


TCA 
Ser 


CTC 
Leu 


CAG 
Gin 


GCG 
Ala 


CCT 
Pro 


GGA ACA 
Gly Thr 


GTG 
Val 


AAA 
Lys 


144 


CCC 
Pro 


CGC 
Arg 


GCT 
Ala 


CTA 
Leu 


GTA 
Val 


CGC 
Arg 


CCG 
Pro 


TCC 
Ser 


CCG 
Pro 


GGA 
Gly 


CCA 
Pro 


GTT 
Val 


CAG 
Gin 


GAG 
Glu 


AAT 
Asn 


CAT 
His 


192 


TTG 
Leu 


TCG 
Ser 


GAA 
Glu 


GCC 
Ala 


CAG 
Gin 


TTT 
Phe 


CCT 
Pro 


CCG 
Pro 


AAG 
Lys 


TGG 
Trp 














222 



<2) INFORMATIONS POUR LA SEQ ID NO: 84: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 74 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: proteine 7,5 kDa 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 84: 

Met Gin Met Pro Ser Thr Gin He Ser Lys Pro Pro Pro Leu Ser Gin 
1 5 10 15 

Thr Pro Val Ser Ala Ala Val Val Val Lys Ala Leu Lys Asn Ser Val 
20 25 30 

Lys Ala Ala Phe Ser Thr Ser Ser Leu Gin Ala Pro Gly Thr Val Lys 
35 40 45 

Pro Arg Ala Leu Val Arg Pro Ser Pro Gly Pro Val Gin Glu Asn His 
50 55 60 

Leu Ser Glu Ala Gin Phe Pro Pro Lys Trp 
65 70 

(2) INFORMATIONS POUR LA SEQ ID NO: 85: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2343 paires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 
(li) TYPE DE MOLECULE: gene de la proteine VPl 

( ix ) CARACTERI STIQUE : 
(A) NOM/CLE: CDS 
- - (B) EMPLACEMENT:!. .2343 - 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 85: 

ATG AGT AAA ACC ACT AAC AAA TGG TGG GAA AGC AGT GAC AAA TTT Onc 
Met Ser Lys Thr Thr Asn Lys Trp Trp Glu Ser Ser Asp ^ p" Sa 

CAG GAC GTG TAT AAG CAG TTT GTG CAA TTT TAT GAA AAA GCT APT rni. 
Gin Asp val Tyr Lys Gin Phe Val Gin Phe Tyr ^ ^ Sa g?J 

Thr tt^ "^"^ """^ AAA GAC CAT TAC AAC ATT TCT 

Thr Asp Leu Glu Leu He Gin He Leu Lys Asp His Tyr Asn lie Ser 

r Im f t*"^ AAC CCC TCT TCT TTA TTT GAC TTA GTT GCT 

Leu Asp Asn Pro Leu Glu Asn Pro Ser Ser Leu Phe Asp Leu Sa 

CGC ATT AAA AGT AAT CTT AAA AAC TCT CCA GAC CTA TAT AGT CAT CAT 
Arg He Lys Ser Asn Leu Lys Asn Ser Pro Asp Leu Tyr Ser His His 

TTT CAG AGC CAT GGA CAG TTA TCT GAC CAC CCC CAT GCC TTA TCA TCC 
Phe Gin Ser His Gly Gin Leu Ser Asp His Pro His Sa J^J sir Ser 

c^'' AGA GGA GAA AAT GCA GTA TTA TCT AGT 

Ser Asn Ser Ser Ala Glu Pro Arg Gly Glu Asn Ala Val £eu I^r Ser 

HAC AAG CCT GGG CAA GTT AGC ATA CAA TTA CCC GGT ACT 
Glu Asp Leu Hxs Lys Pro Gly Gin Val Ser He Gin Leu Pro Gly t" 

AAC TAT GTT GGG CCT GGC AAT GAG CTA CAA GCT GGG CCT CCG CAG AAT 
Asn Tyr Val Gly Pro Gly Asn Glu Leu Gin Ala G^ Pro Pro Gin ^n 

GCT GTG GAC AGT GCT GCA AGG ATT CAT GAC TTT AGG TAT AGC CAA TTG 
Ala val ASP ser Ala Ala Arg He His Asp Phe A^ Sr G^^ Leu 

GCT AAG TTG GGA ATA AAT CCT TAT ACA CAT TGG ACG GTA GCA GAT GAA 
Ala Lys Leu Gly He Asn Pro Tyr Thr His Trp Thr Val A^a Asp G^^ 

^ ^: jji S5 s s; si s?; 

St ^ 2J ?^ S iSi SI S S?I 

TTT CAA GGA AGT TTA CCG GAA GTG CCC GCG TAC AAC GCC TCA GAA aaa 
Phe Gin Gly Ser I,eu Pro Glu Val Pro Ala T^r A^a Ser G^^ ^ 

TAC CCC AGC ATG ACT TCA GTT AAC TCT GCA GAA GCC AGC ACT GGT GCA 
Tyr Pro Ser Met Thr Ser Val Asn Ser Ala All sfr tS GlJ Sa 

Sv ^it c^"" '''''' ^ A-TG AGT GAA GGG GCT 

Gly Gly Gly Gly Ser Asn Pro Thr Lys Ser Met Trp Ser Glu gS Ala 

''^'^ '''"'^ ACA TTC TCT AGG CAA TTT TTA 

Thr Phe Thr Ala Asn Ser Val Thr Cys Thr Phe Ser Arg Gin pSe Leu 

tT! l^^ ^^'^ ^^"^ ^^"^ ^AT AAA GTG TTC TCT CCA GCA GCT 

He Pro Tyr Asp Pro Glu His His Tyr Lys Val Phe Ser Pro S Sa 

Ser sf r 5^'' "^"^ ""^^^ ^ ^AG GCA AAA GTG TGC ACT ATT 

Ser Ser Cys His Asn Ala Ser Gly Lys Glu Ala Lys Val cjs Thr lie 
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96 
144 
192 
240 
288 
336 
384 
432 
480 
528 



672 
720 
768 
816 
864 
912 




AGT CCC ATT ATG GGG TAC 
Ser Pro He Met Gly Tyr 

OCT TTA AAT TTG TTT TTC 
Ala Leu Asn Leu Phe Phe 

AAT TAT GGT AGT ATA GCT 
Asn Tyr Gly Ser lie Ala 

ATT GCT GTA AAA GAT GTC 
He Ala Val Lys Asp Val 

ACT GAC AGC ACC ACA GGA 
Thr Asp Ser Thr Thr Gly 

AAA TAC CCA TAT GTG CTA 
Lys Tyr Pro Tyr Val Leu 

CTG CCC ATT TGG GTT TAC 
Leu Pro He Trp Val Tyr 

GGT GAA GTA AAC ACA CAA 
Gly Glu Val Asn Thr Gin 

AGT GAA GAA TCA GCT TTT 
Ser Glu Glu Ser Ala Phe 

TTG GGT ACA GGG GGA TCT 
Leu Gly Thr Gly Gly Ser 

CCC CCA GAA AAC CTA GAA 
Pro Pro Glu Asn Leu Glu 

AAC CCT TTG TAC GGT TCT 
Asn Pro Leu Tyr Gly Ser 

GAC CCT AAA TTT AGA TCA 
Asp Pro Lys Phe Arg Ser 

CAA AAC TTT ATG CCT GGG 
Gin Asn Phe Met Pro Gly 

GGA GAC AAT TCT AAT ACA 
Gly Asp Asn Ser Asn Thr 

ACT GGC ACT AGC CAA AAC 
Thr Gly Thr Ser Gin Asn 

TCT CAG CCA TAC CAT CAC 
Ser Gin Pro Tyr His His 

AAT GCC ATT TCA CAT GGA 
Asn Ala He Ser His Gly 

GAG TAT CAG CAA GGG GTA 
Glu Tyr Gin Gin Gly Val 

AAG CAG TTA CAA GGT CTT 
Lys Gin Leu Gin Gly Leu 

ACC CAA CAA TAC ACA GAC 
Thr Gin Gin Tyr Thr Asp 

GTT TGG AAC AGA AGA GCT 
Val Trp Asn Arg Arg Ala 

ATC CCT AAC TTA GAT GAC 
He Pro Asn Leu Asp Asp 
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TCT ACT CCG TGG AGA TAC 
Ser Thr Pro Trp Arg Tyr 

TCA CCA TTA GAG TTT CAG 
Ser Pro Leu Glu Phe Gin 

CCA GAT GCT TTA ACT GTA 
Pro Asp Ala Leu Thr Val 

ACA GAC AAA ACA GGA GGA 
Thr Asp Lys Thr Gly Gly 

CGT TTG TGT ATG TTA GTG 
Arg Leu Cys Met Leu Val 

GGT CAG GGA CAA GAC ACA 
Gly Gin Gly Gin Asp Thr 

TTT CCC CCC CAG TAT GCT 
Phe Pro Pro Gin Tyr Ala 

GGA ATT TCA GGA GAC AGC 
Gly He Ser Gly Asp Ser 

TAT GTG TTA GAG CAC AGT 
Tyr Val Leu Glu His Ser 

GCC ACT ATG TCC TAC AAA 
Ala Thr Met Ser Tyr Lys 

GGC TGC AGC CAA CAT TTT 
Gly Cys Ser Gin His Phe 

CGT TTA GGG GTA CCT. GAC 
Arg Leu Gly Val Pro Asp 

TTG ACA CAC GAA GAC CAC 
Leu Thr His Glu Asp His 

CCA CTA ATA AAT TCA GTG 
Pro Leu He Asn Ser Val 

GGT GCT GGA AAA GCC CTT 
Gly Ala Gly Lys Ala Leu 

ACC AGA ATT TCC CTA CGC 
Thr Arg He Ser Leu Arg 

TGG GAC ACT GAT AAA TAT 
Trp Asp Thr Asp Lys Tyr 

CAA ACC ACT TAT GGA AAT 
Gin Thr Thr Tyr Gly Asn 

GGA AGA TTT CCA AAT GAA 
Gly Arg Phe Pro Asn Glu 

AAC ATG CAC ACA TAC TTC 
Asn Met His Thr Tyr Phe 

CAA ATT GAA CGC CCT CTT 
Gin He Glu Arg Pro Leu 

CTT CAC TAT GAA AGT GAG 
Leu His Tyr Glu Ser Gin 

AGT TTT AAA ACT CAA TTT 
Ser Phe Lys Thr Gin Phe 




TTA GAT TTT AAT 960 
Leu Asp Phe Asn 

CAC TTA ATT GAA 100 8 

His Leu He Glu 

ACT ATT TCA GAA 105 6 

Thr He Ser Glu 

GGT GTG CAA GTT 1104 
Gly Val Gin Val 

GAT CAT GAG TAT 1152 
Asp His Glu Tyr 

CTA GCT CCA GAA 1200 
Leu Ala Pro Glu 

TAC TTA ACA GTA 124 8 

Tyr Leu Thr Val 

AAA AAA TTG GCT 1296 
Lys Lys Leu Ala 

TCA TTT GAA CTT 1344 
Ser Phe Glu Leu 

TTT CCA GCT GTG 1392 
Phe Pro Ala Val 

TAT GAA ATG TAC 1440 
Tyr Glu Met Tyr 

ACA TTA GGA GGG 1488 
Thr Leu Gly Gly 

GCA ATT CAG CCA 153 6 

Ala He Gin Pro 

TCT ACC AAA GAA 1584 
Ser Thr Lys Glu 

ACG GGG CTT AGT 1632 
Thr Gly Leu Ser 

CCC GGG CCA GTA 1680 
Pro Gly Pro Val 

GTT ACA GGA ATA 1728 
Val Thr Gly He 

GCT GAG GAC AAA 177 6 

Ala Glu Asp Lys 

AAA GAA CAG CTT 1824 
Lys Glu Gin Leu 

CCT AAT AAA GGA 1872 
Pro Asn Lys Gly 

ATG GTG GGC TCT 1920 
Met Val Gly Ser 

CTG TGG AGT AAA 1968 
Leu Trp Ser Lys 

GCA GCC CTA GGC 2016 
Ala Ala Leu Gly 
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S ?S S S Si -i - - - s 

?s m Si ?n s ?n s s s s 
?s s s s s^? s s^i s s^? si- - 
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160 



Ala Lys Leu Gly lie Asn Pro Tyr Thr His Trp Thr Val Ala Asp Glu 

170 

Glu Leu Leu Lys Asn He Lys Asn Glu Thr Gly Phe Gin Ala Gin Ala 

185 

val Lys Asp Tyr Phe Thr Leu Lys Gly Ala Ala Ala Pro Val Ala His 
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IIS 5S S i^. SI ?S its S Jil SS S= SI S ?S 

SI 5S SI s SI s SI s SI s s 2s ss 
?s SI ?s SI Si ^j; - - s si Si ^ s 
Si Si us s ss Si ^s SI 5s s= Si US 

(2) INFORMATIONS POUR LA SEQ ID NO: 86: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 781 acides amines 

(B) TYPE: acids amine 

(D) CONFIGURATION: lin^aire 

(ii) TVPE DE MOLECULE: prot^ine VPl 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 86: 

Met Ser Lys Thr Thr Asn Lys Trp Trp Glu Ser Ser Asp Lys Phe Ala 
^ 10 15 

Gin Asp Val Tyr Lys Gin Phe Val Gin Phe Tyr Glu Lys Ala Thr Gly 
20 25 30 

Thr Asp Leu Glu Leu He Gin He Leu Lys Asp His Tyr Asn He Ser 

40 45 

Leu Asp Asn Pro Leu Glu Asn Pro Ser Ser Leu Phe Asp Leu Val Ala 

Arg He Lys Ser Asn Leu Lys Asn Ser Pro Asp Leu Tyr Ser His His 

^° 75 80 

Phe Gin Ser His Gly Gin Leu Ser Asp His Pro His Ala Leu Ser Ser 
85 90 95 

ser Asn Ser Ser Ala Glu Pro Arg Gly Glu Asn Ala Val Leu Ser Ser 

105 

Glu Asp Leu His Lys Pro Gly Gin Val Ser He Gin Leu Pro Gly Thr 

120 

Asn Tyr Val Gly Pro Gly Asn Glu Leu Gin Ala Gly p.o Pro Gin Asn 

140 

Ala Val Asp Ser Ala Ala Arg He His Asp Phe Arg Tyr Ser Gin Leu 



205 
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Phe Gin Gly Ser Leu Pro Glu Val Pro Ala Tyr Asn Ala Ser Glu Lys 
210 215 220 

Tyr Pro Ser Met Thr Ser Val Asn Ser Ala Glu Ala Ser Thr Gly Ala 
225 230 235 240 

Glv Glv Glv Gly Ser Asn Pro Thr Lys Ser Met Trp Ser Glu Gly Ala 
^ 245 250 255 

Thr Phe Thr Ala Asn Ser Val Thr Cys Thr Phe Ser Arg Gin Phe Leu 
260 265 270 

lie Pro Tyr Asp Pro Glu His His Tyr Lys Val Phe Ser Pro Ala Ala 
275 280 285 

Ser Ser Cys His Asn Ala Ser Gly Lys Glu Ala Lys Val Cys Thr lie 
290 295 300 

Ser Pro lie Met Gly Tyr Ser Thr Pro Trp Arg Tyr Leu Asp Phe Asn 
305 310 315 320 

Ala Leu Asn Leu Phe Phe Ser Pro Leu Glu Phe Gin His Leu lie Glu 
325 330 335 

Asn Tyr Gly Ser He Ala Pro Asp Ala Leu Thr Val Thr He Ser Glu 
340 345 350 

He Ala Val Lys Asp Val Thr Asp Lys Thr Gly Gly Gly Val Gin Val 
355 360 365 

Thr Asp Ser Thr Thr Gly Arg Leu Cys Met Leu Val Asp His Glu Tyr 
370 375 380 

Lys Tyr Pro Tyr Val Leu Gly Gin Gly Gin Asp Thr Leu Ala Pro Glu 
385 390 395 400 

Leu Pro He Trp Val Tyr Phe Pro Pro Gin Tyr Ala Tyr Leu Thr Val 
405 410 415 

Gly Glu Val Asn Thr Gin Gly He Ser Gly Asp Ser Lys Lys Leu Ala 
420 425 430 

Ser Glu Glu Ser Ala Phe Tyr Val Leu Glu His Ser Ser Phe Glu Leu 
435 440 445 

Leu Gly Thr Gly Gly Ser Ala Thr Met Ser Tyr Lys Phe Pro Ala Val 
450 455 460 

Pro Pro Glu Asn Leu Glu Gly Cys Ser Gin His Phe Tyr Glu Met Tyr 
465 470 475 480 

Asn Pro Leu Tyr Gly Ser Arg Leu Gly Val Pro Asp Thr Leu Gly Gly 
485 490 495 

Asp Pro Lys Phe Arg Ser Leu Thr His Glu Asp His Ala He Gin Pro 
500 505 510 

Gin Asn Phe Met Pro Gly Pro Leu He Asn Ser Val Ser Thr Lys Glu 
515 520 525 

Gly Asp Asn Ser Asn Thr Gly Ala Gly Lys Ala Leu Thr Gly Leu Ser 
530 535 540 

Thr Gly Thr Ser Gin Asn Thr Arg He Ser Leu Arg Pro Gly Pro Val 
545 550 555 560 

Ser Gin Pro Tyr His His Trp Asp Thr Asp Lys Tyr Val Thr Gly He 
565 570 575 
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Asn Ala He Ser His Gly Gin Thr Thr Tyr Gly Asn Ala Glu Asp Lys 

585 



Glu Tyr Gin Gin Gly Val Gly Arg Phe Pro Asn Glu Lys Glu Gin Leu 

600 gQ5 

Gin Gly Leu Asn Met His Thr^Tyr Phe .Pro Asn Lys Gly 

Thr Gin Gin Tyr Thr Asp Gin lie Glu Arg Pro Leu Met Val Gly Ser 

Val Trp Asn Arg Arg Ala Leu His Tyr Glu Ser Gin Leu Trp Ser Lys 
^ 650 

He Pro Asn Leu Asp Asp Ser Phe Lys Thr Gin Phe Ala Ala Leu Gly 

665 670 
Gly Trp Gly Leu His Gin Pro Pro Pro Gin He Phe Leu Lys He Leu 



685 



Pro Gin Ser Gly Pro He Gly Gly He Lys Ser Met Gly He Thr Thr 

695 7QQ 

r.eu Val Gin Tyr Ala Val Gly He Met Thr Val Thr Met Thr Phe Lys 

715 720 

Leu Gly Pro Arg Lys Ala Thr Gly Arg Trp Asn Pro Gin Pro Gly Val 
725 730 

Tyr Pro Pro His Ala Ala Gly His Leu Pro Tyr Val Leu Tyr Asp Pro 

745 750 

Thx Ala Thr Asp Ala Lys Gin His His Arg His Gly Tyr Glu Lys Pro 

760 765 

Glu Glu Leu Trp Thr Ala Lys Ser Arg Val His Pro Leu 

775 

(2) INFORMATIONS POUR LA SEQ ID NO: 87: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 681 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: gene de la proteine VPl unique 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .681 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 87: 

ATG AGT AAA ACC ACT AAC AAA TGG TGG GAA AGC AGT GAC AAA TTT GCr 
Met ser Lys Thr Thr Asn Lys Trp Trp Glu Ser Ser Asp ^ p" ^ 

CAG GAC GTG TAT AAG CAG TTT GTG CAA TTT TAT GAA AAA GCT ACT ora 
Gin ASP val Tyr Lys Gin Phe Val Gin Phe Ty^ G^ A^a Thr 

ACA GAC TTA GAG CTT ATT CAA ATT TTA AAA GAC CAT TAC AAC ATT TCt 
Thr ASP Leu Glu Leu He Gin He Leu Lys Asp hS ^n iH Ser 

TTA GAT AAT CCT TTA GAA AAC CCC TCT TCT TTA TTT GAC TTA GTT GCT 
I-eu Asp Asn Pro Leu Glu Asn Pro Ser Ser Leu Phe Sp Un Val aS 



48 



96 



144 



192 
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CGC ATT AAA AGT AAT CTT AAA AAC TCT CCA GAC CTA TAT AGT CAT CAT 240 
Arg He Lys Ser Asn Leu Lys Asn Ser Pro Asp Leu Tyr Ser His His 

TTT CAG AGC CAT GGA CAG TTA TCT GAC CAC CCC CAT GCC TTA TCA TCC 288 
Phe Gin Ser His Gly Gin Leu Ser Asp His Pro His Ala Leu Ser Ser 

AGT AAC AGT AGT GCA GAA CCT AGA GGA GAA AAT GCA GTA TTA TCT AGT 336 
Ser Asn Ser Ser Ala Glu Pro Arg Gly Glu Asn Ala Val Leu Ser Ser 

GAA GAC TTA CAC AAG CCT GGG CAA GTT AGC ATA CAA TTA CCC GGT ACT 384 
Glu ASP Leu His Lys Pro Gly Gin Val Ser He Gin Leu Pro Gly Thr 

AAC TAT GTT GGG CCT GGC AAT GAG CTA CAA GCT GGG CCT CCG CAG AAT 432 
Asn Tyr Val Gly Pro Gly Asn Glu Leu Gin Ala Gly Pro Pro Gin Asn 

GCT GTG GAC AGT GCT GCA AGG ATT CAT GAC TTT AGG TAT AGC CAA TTG 480 
Ala Val Asp ser Ala Ala Arg He His Asp Phe Arg Tyr Ser Gin Leu 

GCT AAG TTG GGA ATA AAT CCT TAT ACA CAT TGG ACG GTA GCA GAT GAA 528 
Ala Lys Leu Gly He Asn Pro Tyr Thr His Trp Thr Val Ala Asp Glu 

GAA TTG TTA AAA AAT ATA AAA AAT GAA ACA GGG TTT CAA GCA CAA GCA 576 
Glu Leu Leu Lys Asn He Lys Asn Glu Thr Gly Phe Gin Ala Gin Ala 

GTA AAA GAT TAC TTT ACT TTA AAA GGT GCA GCT GCC CCT GTG GCC CAT 624 
Val Lys Asp Tyr Phe Thr Leu Lys Gly Ala Ala Ala Pro Val Ala Hxs 

TTT CAA GGA AGT TTA CCG GAA GTG CCC GCG TAC AAC GCC TCA GAA AAA 672 
Phe Gin Gly Ser Leu Pro Glu Val Pro Ala Tyr Asn Ala Ser Glu Lys 

TAC CCC AGC 
Tyr Pro Ser 

(2) INFORMATIONS POUR LA SEQ ID NO: 88: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 227 acides amines 

(B) TYPE: acide aiain6 
(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: protiine VPl unique 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 88: 

Met Ser Lys Thr Thr Asn Lys Trp Trp Glu Ser Ser Asp Lys Phe Ala 

1 ■ 5 

Gin Asp Val Tyr Lys Gin Phe Val Gin -P^^ Glu Lys Ala Thr Gly 

20 ' 25jt 30 

Thr Asp Leu Glu Leu He Gin He Leu Lys Asp His Tyr Asn He Ser 
35 40 ^ 45 

Leu Asp Asn Pro Leu Glu Asn Pro Ser Ser Leu Phe Asp Leu Val Ala 
50 55 60 

Arg He Lys Ser Asn Leu Lys Asn Ser Pro Asp Leu Tyr Ser His His 
65 70 75 80 

Phe Gin ser His Gly Gin Leu Ser Asp His Pro His Ala Leu Ser Ser 

90 35 



85 



Ser Asn Ser Ser Ala Glu Pro Arg Gly Glu Asn Ala Val Leu Ser Ser 
100 105 110 

Glu Asp Leu His Lys Pro Gly Gin Val Ser He Gin Leu Pro Gly Thr 
115 120 125 



681 
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Asn Tyr Val Oly Pro Gly Asn Glu Leu Gin Ala Gly Pro Pro Gin Asn 
Ala val Asp Ser Ala Ala Arg He His Asp Phe Arg Tyr Ser Gin Leu 

Ala Lys Leu Gly lie Asn Pro Tyr Thr His Trp Thr Val Ala Asp Glu 

165 - - 170 - - 

Glu Leu Leu Lys Asn He Lys Asn Glu Thr Gly Phe Gin Ala Gin Ala 
" 185 

val Lys Asp Tyr Phe Thr Leu Lys Gly Ala Ala Ala Pro Val Ala His 
■^'^ 200 205 

Phe Gin Gly Ser Leu Pro Glu Val Pro Ala Tyr Asn Ala Ser Glu Lys 



220 



Tyr Pro Ser 
225 



(2) INFORMATIONS POUR LA SEQ ID NO: 89: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 306 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siir^le 

(D) CONFIGURATION: lineaire 

- (ii) TYPE DE MOLECULE: gene de la proteine X 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .306 



(xi) DESCRIPTION DE 

TTG CTC GCA TTA AAA GTA 
Leu Leu Ala Leu Lys Val 

ATC ATT TTC AGA GCC ATG 
He He Phe Arg Ala Met 

CAT CCA GTA ACA GTA GTG 
His Pro Val Thr Val Val 

CTA GTG AAG ACT TAC ACA 
Leu Val Lys Thr Tyr Thr 

GTA CTA ACT ATG TTG GGC 
Val Leu Thr Met Leu Gly 

AGA ATG CTG TGG ACA GTG 
Arg Met Leu Trp Thr Val 

AAT TGG CTA AGT TGG GAA 
Asn Trp Leu Ser Trp Glu 



LA SEQUENCE: SEQ ID NO: 

ATC TTA AAA ACT CTC CAG 
He Leu Lys Thr Leu Gin 

GAC AGT TAT CTG ACC ACC 
Asp Ser Tyr Leu Thr Thr 

CAG AAC CTA GAG GAG AAA 
Gin Asn Leu Glu Glu Lys 

AGC CTG GGC AAG TTA GCA 
Ser Leu Gly Lys Leu Ala 

CTG GCA ATG AGC TAC AAG 
Leu Ala Met Ser Tyr Lys 

CTG CAA GGA TTC ATG ACT 
Leu Gin Gly Phe Met Thr 



89: 

ACC TAT ATA GTC 48 
Thr Tyr He Val 

CCC ATG CCT TAT 96 
Pro Met Pro Tyr 

ATG CAG TAT TAT 144 
Met Gin Tyr Tyr 

TAC AAT TAC CCG 192 
Tyr Asn Tyr Pro 

CTG GGC CTC CGC 240 
Leu Gly Leu Arg 

TTA GGT ATA GCC 288 
Leu Gly He Ala 

306 



(2) INFORMATIONS POUR LA SEQ ID NO: 90: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 102 acides amines 

(B) TYPE: acide amin6 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: prot^ine X 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 90: 

Leu Leu Ala Leu Lys Val He Leu Lys Thr Leu Gin Thr Tyr He Val 
15 10 15 

He He Phe Arg Ala Met Asp Ser Tyr Leu Thr Thr Pro Met Pro Tyr 
20 25 30 

His Pro Val Thr Val Val Gin Asn Leu Glu Glu Lys Met Gin Tyr Tyr 
35 40 45 

Leu Val Lys Thr Tyr Thr Ser Leu Gly Lys Leu . Ala Tyr Asn Tyr 
50 55 60 

Val Leu Thr Met Leu Gly Leu Ala Met Ser Tyr Lys Leu Gly Leu 
65 70 75 

Arg Met Leu Trp Thr Val Leu Gin Gly Phe Met Thr Leu Gly He 
85 90 95 

Asn Trp Leu Ser Trp Glu 
100 

(2) INFORMATIONS POUR LA SEQ ID NO: 91: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1662 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: gene de la proteine VP2 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .1662 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 91: 



ATG 


ACT 


TCA 


GTT 


AAC 


TCT 


GCA 


GAA 


GCC 


AGC 


ACT 


GGT 


GCA 


GGC 


GGG 


GGA 


48 


Met 


Thr 


Ser 


Val 


Asn 


Ser 


Ala 


Glu 


Ala 


Ser 


Thr 


Gly 


Ala 


Gly 


Gly 


Gly 






105 










110 










115 










GGT 


AGC 


AAC 


CCT 


ACA 


AAA 


AGC 


ATG 


TGG 


AGT 


GAA 


GGG 


GCT 


ACA 


TTT 


ACT 


96 


Gly 


Ser 


Asn 


Pro 


Thr 


Lys 


Ser 


Met 


Trp 


Ser 


Glu 


Gly 


Ala 


Thr 


Phe 


Thr 




GCT 


AAT 


TCT 


GTA 


ACG 


TGT 


ACA 


TTC 


TCT 


AGG 


CAA 


TTT 


TTA 


ATT 


CCA 


TAT 


144 


Ala 


Asn 


Ser 


Val 


Thr 


Cys 


Thr 


Phe 


Ser 


Arg 


Gin 


Phe 


Leu 


He 


Pro 


Tyr 




GAT 


CCA 


GAG 


CAT 


CAT 


TAT 


AAA 


GTG 


TTC 


TCT 


CCA 


GCA 


GCT 


AGT 


AGC 


TGC 


192 


Asp 


Pro 


Glu 


His 


His 


Tyr 


Lys 


Val 


Phe 


Ser 


Pro 


Ala 


Ala 


Ser 


Ser 


Cys 




CAC 


AAT 


GCT 


AGT 


GGG 


AAA 


GAG 


GCA 


AAA 


GTG 


TGC 


ACT 


ATT 


AGT 


CCC 


ATT 


240 


His 


Asn 


Ala 


Ser 


Gly 


Lys 


Glu 


Ala 


Lys 


Val 


Cys 


Thr 


He 


Ser 


Pro 


He 




ATG 


GGG 


TAG 


TCT 


ACT 


CCG 


TGG 


AGA 


TAG 


TTA 


GAT 


TTT 


AAT 


GCT 


TTA 


AAT 


288 


Met 


Gly 


Tyr 


Ser 


Thr 


Pro 


Trp 


Arg 


Tyr 


Leu 


Asp 


Phe 


Asn 


Ala 


Leu 


Asn 




TTG 


TTT 


TTC 


TCA 


CCA 


TTA 


GAG 


TTT 


CAG 


CAC 


TTA 


ATT 


GAA 


AAT 


TAT 


GGT 


336 


Leu 


Phe 


Phe 


Ser 


Pro 


Leu 


Glu 


Phe 


Gin 


His 


Leu 


He 


Glu 


Asn 


Tyr 


Gly 




AGT 


ATA 


GCT 


CCA 


GAT 


GCT 


TTA 


ACT 


GTA 


ACT 


ATT 


TCA 


GAA 


ATT 


GCT 


GTA 


384 


Ser 


He 


Ala 


Pro 


Asp Ala 


Leu 


Thr 


Val 


Thr 


He 


Ser 


Glu 


He 


Ala 


Val 




AAA 


GAT 


GTC 


ACA 


GAC 


AAA 


ACA 


GGA 


GGA 


GGT 


GTG 


CAA 


GTT 


ACT 


GAC 


AGC 


432 


Lys 


Asp 


Val 


Thr 


Asp 


Lys 


Thr 


Gly 


Gly 


Gly 


Val 


Gin 


Val 


Thr 


Asp 


Ser 





Pro 



Arg 
80 



Ala 
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S IS ^ S S - - - "0 

SI? s; s s - s s ?n 
s s s ss-^' s rji s ?it Si ?2 

?s s s ^ SI J2 
12 SI s SI 51? n; SI IS SI Si s us s ?s 

S5 I- SI ?S S 12 ^ ^ SI Si SI ?I? SI Si .°?i 

f^* ^ TAT GAA ATG TAC AAC CCT TTG 

Asn Leu Glu Gly Cys Ser Gin His Phe Tyr Glu Met J^n So Leu 

^ G?3 c"^ ^""^ P"" """^ ^^"^ ACA TTA GGA GGG GAC CCT AAA 

Tyr Gly Ser Arg Leu Gly Val Pro Asp Thr Leu Gly Gly Asp Pro ^ 

Phi r° ^S'^ °AC CAC GCA ATT CAG CCA CAA AAC TTT 

Phe Arg Ser Leu Thr His Glu Asp His Ala He Gin Pro SlJ pS 

tit P^^ ^^"^ '^'^'^ TCT ACC AAA GAA GGA GAC AAT 

Met Pro Gly Pro Leu He Asn Ser Val Ser Thr Lys Glu Gly 2p 

III Su* ^* *^ CTT ACG GGG CTT AGT ACT GGC ACT 

ser Asn Thr Gly Ala Gly Lys Ala Leu Thr Gly Leu Ser S S Thr 

AGC CAA AAC ACC AGA ATT TCC CTA CGC CCC GGG CCA GTA TCT CAG CCA 
ser Gin Asn Thr Arg He Ser Leu Arg Pro Gly Pro v2 Ser Pro 

sti ?s lit I- ^ - G^s ^1 r.i 

Hil C^J S Sr^ G^J SI ^ - - 

G^^ vlt "^"^ CAG CTT AAG CAG TTA 

Gin Gly Val Gly Arg Phe Pro Asn Glu Lys Glu Gin Leu Lys Gin Leu 

CAA GGT CTT AAC ATG CAC ACA TAC TTC CCT AAT AAA GGA ACr riA niv,v 
Gin Gly Leu Asn Met His Thr Tyr Phe Pro SI ^ ^ G^^ G^^ 

TAC ACA GAC CAA ATT GAA CGC CCT CTT ATG GTG GGC TCT GTT TGG AAP 
Tyr Thr Asp Gin He Glu Arg Pro Leu Met Val ^ Ser v" Sn 

AGA AGA GCT CTT CAC TAT GAA AGT CAG CT6 TGG AGT AAA ATC CCT AAr 
Arg Arg Ala Leu His Tyr Glu Ser Gin Leu Trp sir ^ He Pro ^n 

.^i SI J- s ^ G^ r.i sg s 
r.^ IS s G^ s J- sji ill L-s ^.s iTr 
sg §s §5 s Sr^ G=?j ill s L^^^ ^ti 

TAT GCT GTG GGA ATA ATG ACA GTT ACC ATG ACC TTT AAA TTG GGA rrT ,>,o« 
Tyr Ala Val Gly He Met Thr Val Thr Met tS ^ Z^u ^y Pro 

It^ ^u*^ CCC CAG CCT GGC GTT TAT CCT CCT 

Arg t,ys Ala Thr Gly Arg Trp Asa Pro Gin Pro G^ Val Sr Pro Pro 



672 
720 
768 
816 
864 
912 
960 
1008 



1104 
1152 
1200 
1248 
1296 
1344 



1536 
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CAT GCA GCT GGT CAT TTA CCA TAT GTA CTG TAT GAC CCC AC A GCT AC A 1584 
His Ala Ala Gly His Leu Pro Tyr Val Leu Tyr Asp Pro Thr Ala Thr 

GAT GCA AAG CAA CAC CAC AGA CAC GGA TAT GAA AAG CCT GAA GAA TTG 1632 
Asp Ala Lys Gin His His Arg His Gly Tyr Glu Lys Pro Glu Glu Leu 

TGG ACT GCC AAA AGC CGT GTG CAC CCA TTG 1662 
Trp Thr Ala Lys Ser Arg Val His Pro Leu 

(2) INFORMATIONS POUR LA SEQ ID NO: 92: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 554 acides amines 

(B) TYPE: acide amin^ 

(D) CONFIGURATION: lineaire . 

(ii) TYPE DE MOLECULE: proteine VP2 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 92: 

Met Thr Ser Val Asn Ser Ala Glu Ala Ser Thr Gly Ala Gly Gly Gly 
1 5 10 15 

Glv Ser Asn Pro Thr Lys Ser Met Trp Ser Glu Gly Ala Thr Phe Thr 
20 25 30 

Ala Asn Ser Val Thr Cys Thr Phe Ser Arg Gin Phe Leu He Pro Tyr 
35 40 45 

Asp Pro Glu His His Tyr Lys Val Phe Ser Pro Ala Ala Ser Ser Cys 
50 55 60 

His Asn Ala Ser Gly Lys Glu Ala Lys Val Cys Thr He Ser Pro lie 
65 70 75 80 

Met Gly Tyr Ser Thr Pro Trp Arg Tyr Leu Asp Phe Asn Ala Leu Asn 
85 90 

Leu Phe Phe Ser Pro Leu Glu Phe Gin His Leu He Glu Asn Tyr Gly 
100 105 110 

Ser He Ala Pro Asp Ala Leu Thr Val Thr He Ser Glu lie Ala Val 
lis 120 125 

Lys Asp Val Thr Asp Lys Thr Gly Gly Gly Val Gin Val Thr Asp Ser 
130 135 140 

Thr Thr Gly Arg Leu Cys Met Leu Val Asp His Glu Tyr Lys Tyr Pro 
145 150 155 160 

Tvr Val Leu Gly Gin Gly Gin Asp Thr Leu Ala Pro Glu Leu Pro He 
165 170 175 

Trp Val Tyr Phe Pro Pro Gin Tyr Ala Tyr Leu Thr Val Gly Glu Val 
180 185 190 

Asn Thr Gin Gly He Ser Gly Asp Ser Lys Lys Leu Ala Ser Glu Glu 
195 200 205 

Ser Ala Phe Tyr Val Leu Glu His Ser Ser Phe Glu Leu Leu Gly Thr 
210 215 220 

Glv Gly Ser Ala Thr Met Ser Tyr Lys Phe Pro Ala Val Pro Pro Glu 
225 230 235 240 

Asn Leu Glu Gly Cys Ser Gin His Phe Tyr Glu Met Tyr Asn Pro Leu 
245 250 255 
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Tyr Gly Ser Arg Leu Oly Val Pro Asp Thr Leu Gly Gly Asp Pro Lys 

265 270 

Phe Arg Ser Leu Thr His Glu Asp His Ala He Gin Pro Gin Asn Phe 

280 285 

Met Pro Gly Pro Leu He Asn Ser Val Ser Thr Lys Glu Gly Asp Asn 



- 3 00 



ser Asn Thr Gly Ala Gly Lys Ala Leu Thr Gly Leu Ser Thr Gly Thr 

3X5 320 
ser Gin Asn Thr Arg lie Ser Leu Arg Pro Gly Pro Val Ser Gin Pro 

Tyr His His Trp Asp Thr Asp Lys Tyr Val Thr Gly He Asn Ala He 

345 350 

ser His Gly Gin Thr Thr Tyr Gly Asn Ala Glu Asp Lys Glu Tyr Gin 

360 3g5 

Gin Gly Val Gly Arg Phe Pro Asn Glu Lys Glu Gin Leu Lys Gin Leu 



380 



Gin Gly Leu Asn Met His Thr Tyr Phe Pro Asn Lys Gly Thr Gin Gin 

jyO 395 



400 



Tyr Thr Asp Gin lie Glu Arg Pro Leu Met Val Gly Ser Val Trp Asn 

410 

Arg Arg Ala Leu His Tyr Glu Ser Gin Leu Trp Ser Lys He Pro Asn 
«20 425 43Q 

Leu Asp Asp Ser Phe Lys Thr Gin Phe Ala Ala Leu Gly Gly Trp Gly 

440 

Leu His Gin Pro Pro Pro Gin He Phe Leu Lys He Leu Pro Gin Ser 

455 460 

Gly Pro He Gly Gly He Lys Ser Met Gly He Thr Thr Leu Val Gin 

475 480 

Tyr Ala Val Gly He Met Thr Val Thr Met Thr Phe Lys Leu Gly Pro 
«85 490 

Arg Lys Ala Thr Gly Arg Trp Asn Pro Gin Pro Gly Val Tyr Pro Pro 



His Ala Ala Gly His Leu Pro Tyr Val Leu Tyr Asp Pro Thr Ala Thr 

520 525 

Asp Ala Lys Gin His His Arg His Gly Tyr Glu Lys Pro Glu Glu Leu 

535 

Trp Thr Ala Lys Ser Arg Val His Pro Leu 
545 550 

(2) INFORMATIONS POUR LA SEQ ID NO: 93: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 396 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: gene de la proteine 11 kDa 
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{ ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .396 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 93: 



CCT 
Pro 


TTA 
Leu 


AAT 
Asn 


TGG 
Trp 


GAC 
Asp 


CTC 
Leu 


GAA 
Glu 


AGG 
Arg 


CTA 
Leu 


CTG 
Leu 


GAA 
Glu 


GGT GGA 
Gly Gly 


ATC 
He 


CCC 
Pro 


AGC 
Ser 


48 


CTG 
Leu 


GCG 
Ala 


TTT 
Phe 


ATC 
He 


CTC 
Leu 


CTC 
Leu 


ATG 
Met 


CAG 
Gin 


CTG 
Leu 


GTC 
Val 


ATT TAC 

He .Tyr 


CAT 
His 


ATG 
Met 


TAC 
Tyr 


TGT 
Cys 


96 


ATG 
Met 


ACC 
Thr 


CCA 
Pro 


CAG 
Gin 


CTA 
Leu 


CAG 
Gin 


ATG 
Met 


CAA 
Gin 


AGC 
Ser 


AAC 
Asn 


ACC 
Thr 


ACA 
Thr 


GAC 
Asp 


ACG 
Thr 


GAT 
Asp 


ATG 
Met 


144 


AAA 
Lys 


AGC 
Ser 


CTG 
Leu 


AAG 
Lys 


AAT 
Asn 


TGT 
Cys 


GGA 
Gly 


CTG 
Leu 


CCA 
Pro 


AAA 
Lys 


GCC 
Ala 


GTG 
Val 


TGC 
Cys 


ACC 
Thr 


CAT 
His 


TGT 
Cys 


192 


AAA 
Lys 


CAT 
His 


TCC 
Ser 


CCA 
Pro 


CCG 
Pro 


TGT 
Cys 


CCT 
Pro 


CAG 
Gin 


CCA 
Pro 


GGA 
Gly 


ACC 
Thr 


GTC 
Val 


ACC 
Thr 


CAC 
His 


CGC 
Arg 


CCA 
Pro 


240 


CCT 
Pro 


GTG 
Val 


CCG 
Pro 


CCC 
Pro 


AGA 
Arg 


TTA 
Leu 


TAT 
Tyr 


GTG 
Val 


CCC 
Pro 


CCT 
Pro 


CCA 
Pro 


ATA 
He 


CCC 
Pro 


CGT 
Arg 


AGG 
Arg 


CAA 
Gin 


288 


CCA 
Pro 


TCT 
Ser 


ATA 
lie 


AAA 
Lys 


GAT 
Asp 


ACA 
Thr 


GAC 
Asp 


GCT 
Ala 


GTA 
Val 


GAA 
Glu 


TAT 
Tyr 


AAA 
Lys 


TTA 
Leu 


TTA 
Leu 


ACT 
Thr 


AGA 
Arg 


336 


TAT 
Tyr 


GAA 
Glu 


CAA 
Gin 


CAT 
His 


GTA 
val 


ATT 
He 


AGA 
Arg 


ATG 
Met 


CTA 
Leu 


AGA 
Arg 


TTA 
Leu 


TGT 
Cys 


AAT 
Asn 


ATG 
Met 


TAC 
Tyr 


ACA 
Thr 


3 84 


AGT 
Ser 


TTG 
Leu 


GAA 
Glu 


AAA 
Lys 
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(2) INFORMATIONS POUR LA SEQ ID NO: 94: 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 132 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 11 kDa 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 94: 

Pro Leu Asn Trp Asp Leu Glu Arg 
1 5 

Leu Ala Phe He Leu Leu Met Gin 
20 

Met Thr Pro Gin Leu Gin Met Gin 
35 40 

Lys Ser Leu Lys Asn Cys Gly Leu 
50 55 

Lys His Ser Pro Pro Cys Pro Gin 
65 70 

Pro Val Pro Pro Arg Leu Tyr Val 
85 

Pro Ser He Lys Asp Thr Asp Ala 
100 

Tyr Glu Gin His Val He Arg Met 
115 120 



Leu Leu 
10 

Leu Val 
25 

Ser Asn 

Pro Lys 

Pro Gly 

Pro Pro 
90 

Val Glu 
105 

Leu Arg 



Glu Gly 

He Tyr 

Thr Thr 

Ala Val 
60 

Thr Val 
75 

Pro He 
Tyr Lys 
Leu Cys 



Gly He 

His Met 
30 

Asp Thr 
45 

Cys Thr 
Thr His 



Pro Arg 



Leu Leu 
110 



Asn Met 
125 



Pro Ser 
15 

Tyr Cys 

Asp Met 

His Cys 

Arg Pro 
80 

Arg Gin 
95 

Thr Arg 
Tyr Thr 
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Ser Leu Glu Lys 
130 



(2) INFORMATIONS POUR LA SEQ ID NO: 95: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 40 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VPla 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 95: 

Met Ser Lys Thr Thr Asn Lys Trp Trp Glu Ser Ser Asp Lys Phe Ala 
5 10 15 

Gin Asp Val Tyr Lys Gin Phe Val Gin Phe Tyr Glu Lys Ala Thr Gly 

Thr Asp Leu Glu Leu lie Gin lie 
35 40 

(2) INFORMATIONS POUR LA SEQ ID NO: 96: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 acides amines* 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VPlb 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 96: 

Ser Leu Phe Asp Leu Val Ala Arg He Lys Ser Asn Leu Lys Asn Ser 



30 



10 15 



Pro Asp Leu Tyr Ser 
20 



(2) INFORMATIONS POUR LA SEQ ID NO : 97: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 24 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VPlc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 97 

Ser Si 

10 15 



Leu Ser Asp His Pro His Ala Leu Ser Ser Ser Asn Ser Ser Ala Glu 



Pro Arg Gly Glu Asn Ala Val Leu 
20 

(2) INFORMATIONS POUR LA SEQ ID NO: 98: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 21 acides amines 

(B) TYPE: acide amine 
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(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VPld 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 98: 

Glu Asp Leu His Lys Pro Gly Gin Val Ser Xle Gin Leu Pro Gly Thr 
15 10 15 

Asn Tyr Val Gly Pro 
20 



(2) INFORMATIONS POUR LA SEQ ID NO: 99: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VPle 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 99: 

Gly Asn Glu Leu Gin Ala Gly Pro Pro Gin Asn Ala Val Asp Ser Ala 
15 10 15 

Ala Arg lie His Asp Phe 
20 

(2) INFORMATIONS POUR LA SEQ ID NO: 100: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VPlf 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 100: 

lie Lys Asn Glu Thr Gly Phe Gin Ala Gin Ala Val Lys Asp Tyr Phe 
15 10 3.5 



Thr Leu Lys Gly Ala 
20 



(2) INFORMATIONS POUR LA SEQ ID NO: 101: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VP2a 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 101: 

Ser Thr Gly Ala Gly Gly Gly Gly Ser Asn Pro Thr Lys Ser Met Trp 
15 10 15 

Ser Glu Gly Ala Thr Phe Thr Ala Asn Ser Val Thr Cys Thr Phe Ser 
20 25 30 



• « 
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(2) INFORMATIONS POUR LA SEQ ID NO: 102: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 21 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VP2b 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 102: 

Pro Pro Gin Tyr Ala Tyr Leu Thr Val Gly Glu Val Asn Thr Gin Gly 

10 15 

lie Ser Gly Asp Ser 
20 



(2) INFORMATIONS POUR LA SEQ ID NO: 103: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 3 7 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VP2c 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 103: 

Ala Phe Tyr Val Leu Glu His Ser Ser Phe Glu Leu Leu Gly Thr Gly 

10 15 

Gly Ser Ala Thr Met Ser Tyr Lys Phe Pro Ala Val Pro Pro Glu Asn 
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Leu Glu Gly Cys Ser 
35 



(2) INFORMATIONS POUR LA SEQ ID NO: 104: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 28 acides amines* 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide VP2d 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 104: 

Gin Asn Phe Met Pro Gly Pro Leu He Asn Ser Val Ser Thr Lys Glu 
5 10 15 

Gly Asp Asn Ser Asn Thr Gly Ala Gly Lys Ala Leu 
20 25 

(2) INFORMATIONS POUR LA SEQ ID NO: 105: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 105 
TGCAGATGCC CTCCACCCA 

(2) INFORMATIONS POUR LA SEQ ID NO: 106: 

(i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 106 
GCTGCTTTCA CTGAGTTCTT C 

(2) INFORMATIONS POUR LA SEQ ID NO: 107: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 107 
GACCAGTTCA GGAGAATCAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 108: 

(i) CARACTiERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE. DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE SEQUENCE: SEQ ID NO: 108 
ATCGGCAAGC GGCGTGTAA 

(2) INFORMATIONS POUR LA SEQ ID NO: 109: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 109 
ATCCAGACAG GTAAGCACAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 110: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 21 paires de bases " " " 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "SONDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 110: 
ATCGGCAAGC GGCGTGTAAA A 

(2) INFORMATIONS POUR LA SEQ ID NO: 111: 

(i) CARACTERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 19 paires de basis 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 111: 
CATGCCTTAT CATCCAGTA 

(2) INFORMATIONS POUR LA SEQ ID NO: 112: 

(i) CARACTERISTIQUES DE LA SEQUENCE • 

(A) LONGUEUR: 20 paires de . bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleioue 
(A) DESCRIPTION: /desc = "AMORCE" 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID* NO: 
TTGGCTATAC CTAAAGTCAT 
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REVENDICATIONS 

1°) Sequence d'acide nucleique, caracterisee en ce qu'elle est selec- 
tionnee dans le groupe constitue par les sequences issues d'un erythrovirus, qui, naole- 
culairement, ne peut etre reconnu conune un erythrovirus B19, et denomme variant de 
5 type V9, car presentant une divergence genetique > 10% sur I'ensemble du genome 
par rapport aux sequences de I'erythrovirus B19, la sequence SEQ ID NO:l et les 
sequences nucleotidiques capables de s'hybrider avec ladite sequence ID NO:l. 

2°) Sequence nucleique selon la revendication 1, caracterisee en ce 
qu'elle presente un profil de restriction different de celui de rerythrovirus B19, 

10 notamment par les sites de restrictions suivants : Acc I, Afl III, Alw I, AlwN I, Apa I, 
Ava I, Ava H, Avr II, BamH I, Ban I, Ban II, Bbe I, Bbs I, BceF I, Beg I, Ben I, Bgl 
n, Bsg I, BsiE I, Bsm I, BsmA I, Bspl20 I, BspH I, BspM I, BsrF I, Bstl 107 I, BstE 
II, BstU I, Bsu36 I, Dpn I, Dra HI, Dsa I, Eae I, Eag I, Ear I, EcI136 I, EcoN I, 
Ecol09 I, EcoR I, Ehe I, Fok I, Hae I, Hae IH, Hga I, HgiA I, Hha I, Hinc H, Hind 

15 m, HinP I, Hpa I, Kas I, Mae H, Mbo I, Mcr I, Msc I, Mun I, Nar I, Nci I, Nco I, Nsi 
I, Nsp I, Nsp7524 I, NspB H, NspC I, PflM I, Pme I, PpulO I, PpuM I, Pst I, Pvu U, 
Sac I, Sau3A I, Sea I, SfaN I, Sfc I, Sma I, Spe I, Sph I, Ssp I, Stu I, Sty I, Swa I, 
Tthllll, Xbal, Xma l. 

3°) Fragments de la sequence ID NO:l, aptes a permettre la detec- 

20 tion d'un erythrovirus V9, caract crises en ce qu'ils comprennent une sequence nucleo- 
tidique selectionnee dans le groupe constitue par : 

a) les sequences SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, 
SEQ ID NO:89, SEQ ED N0:91 ou SEQ ED NO:93, 

b) les sequences nucleotidiques capables de s'hybrider avec Tune des sequences SEQ 
25 ID NO:l, SEQ DD NO:81, SEQ ID NO:83, SEQ ED NO:85, SEQ ID NO:87, SEQ ED 

NO:89, SEQ ED N0:91 ou SEQ ID NO:93, 

c) les sequences SEQ ED NO:2-80 

d) les sequences SEQ ID NO:105-112 et 

e) les sequences complementaires des sequences precedentes, les fragments issus des 
30 sequences precedentes d'au moins 17 nucleotides ou leurs sequences complementaires. 

4^) Fragment selon la revendication 3, caracterise en ce qu'il est 
selectionne dans le groupe constitue par les sequences SEQ ED NO:45-80, 108 et 
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NO:l 10, leurs sequences complementaires. les sequences issues de ces sequences d'au 
moins 17 nucleotides et les sequences comprenant lesdites sequences et en ce qu'il est 
apte a servir de sonde dans I 'identification specifique d'un erythrovims de type V9 ou 
d'un erythroyirus apparente.. 

^ • Fragment selon la revendication 3, caracterise en ce qu'il est 

selectionne dans le groupe constitue par les sequences SEQ ID NO-2-80 et les 
sequences SEQ ID NO:105-112, leurs sequences complementaires. les sequences 
issues de ces sequences d'au moins 17 nucleotides et les sequences comprenant lesdites 
sequences et en ce qu'il est apte a servir d'amorce pour I'amplification de sequences 
10 issues d'un erythrovirus. 

6°) Paires d'amorces, caracterisees en ce qu'elles sent selectionnees 
dans le groupe constitue par : 

- la paire A : amorces SEQ ID NO: 1 1 1 et SEQ ID NO: 1 12 ; 

- la paire B : amorces SEQ ID NO: 105 et SEQ ID NO: 106 ; 

- la paire C : I'une des sequences SEQ ID NO:2-44, 105, 106, 107, 
109, 1 1 1 ou 1 12 et I'une des sequence SEQ ID NO:45-80, 108 ou 1 10 ; 

- la paire D : amorce SEQ ID NO: 107 et amorce SEQ ID NO: 109 ; 

- la paire E : deux amorces selectionnees parmi les sequences SEQ 
ID NO:2-44. 105. 106, 107, 109, 1 1 1 ou 1 12 ; et 

" P^'""® F '■ <*eux amorces selectionnees parmi les sequences SEQ ID 
NO:45-80, 108 ou 110. 

7°) Erythrovirus variant, caracterise en ce qu'il ne peut Stre reconnu 
moleculairement comme un erythrovirus B19, en ce qu'U presents une divergence 
genetique < 10 % avec I'erythrovirus V9, tel que defini a la revendication 1 et en ce 
25 que son genome s'hybride specifiquement avec I'une des sequences SEQ ID NO:45 a 
80, 108 et 110. 

8°) Plasmide, caracterise en ce qu'il comprend le genome viral d'une 
souche d'erythrovims variant, denommee erythrovirus V9, ne pouvant etre recomiue 
moleculairement comme un erythrovirus B19 et presentant avec ce dernier une diver- 
30 gence genetique > 10 % sur I'ensemble du genome, par rapport aux sequences de 

rerythrovirusB19. 




67 

9^) Plasmide selon la revendication 8, caracterise en ce qu'il inclut la 
sequence SEQ ID N0:1. 

10^) Plasmide selon la revendication 9, caracterise en ce qu'il a ete 
depose aupres de la Collection Nationale de Culture de Microorganismes (CNCM) en 
5 date du 18 novembre 1997 sous le n*^ 1-1940, incorpore dans une bacterie Escherichia 
coli. 

11°) Reactif de diagnostic pour la detection differentielle des erythro- 
virus de type V9, caracterise en ce qu'ii est selectionne parmi les sequences SEQ ID 
NO:45-80, 108 et 110, leurs sequences complementaires, les sequences issues de ces 

10 sequences d'au moins 17 nucleotides et les sequences comprenant lesdites sequences, 
eventuellement marquees avec un marqueur approprie. 

12°) Procede de diagnostic rapide et diflferentiel des erythrovirus, par 
hybridation et/ou amplification genique, realise a partir d'un echantillon biologique, 
lequel procede est caracterise en ce qu'il comprend : 

15 (1) une etape dans laquelle Ton met en contact un echantillon biolo- 

gique a analyser avec au moins une sonde de sequence SEQ ID NO:45-80, 108 ou 110 
et 

(2) une etape dans laquelle on detecte par tout moyen approprie le ou 
les produits resuhant de Tinteraction sequence nucleotidique d'erythrovirus-sonde. 
20 13°) Procede selon la revendication 12, caracterise en ce qu'il 

comprend, prealablement a T etape (1) : 

. une etape d' extraction de I'acide nucleique a detecter, appartenant 
au genome du virus, eventuellement present dans Techantillon biologique, et 
. au moins un cycle d' amplification genique. 
25 14°) Procede selon la revendication 13, caracterise en ce que les 

cycles d' amplification sont realises a Taide d'une paire d'amorces selon la revendica- 
tion 6. 

15°) Utilisation des sequences selon Tune quelconque des revendica- 
tions 1 a 5 pour la mise en oeuvre d'un procede d*hybridation ou d' amplification 
30 genique de sequence nucleiques d' erythrovirus pour le diagnostic in vitro de Tinfection 
potentielle d'un individu par un erythrovirus. 
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15 



20 



25 



30 



16°) Precede de criblage et de typage d'un erythrovims V9 ou appa- 
rente. caracterise en ce qu'il comprend la mise en contact d'une sonde selectioonee 
dans le groupe constitue par les sequences selon la revendication 4, eventuellement 
marquee avec I'acide nucleique du virus a typer, eventuellement marque, et la detection 
5 de I'hybride acide nucleique-sonde obtenu. 

17°) Produits de traduction, caracterises en ce qu'ils sont codes par 
une sequence nucleotidique selon la revendication 1. 

18°) Proteine, caracterisee en ce qu'elle est susceptible d'etre expri- 
mee a I'aide d'une sequence nucleotidique selon la revendication 1. 

19°) Proteine ou peptide, caracterise en ce qu'il est issu d'un 
erythrovims variant de type V9. tel que defini a la revendication 1 et en ce qu'U est 
selectiomie parmi les sequences SEQ ID NO:82 (proteine NSl), SEQ ID NO-86 
(proteine VPl). SEQ ID NO:88 (proteine VPl unique). SEQ ID NO:92 (proteine 
VP2) et SEQ ID NO:95-104, a savoir des fragments de la proteine VPl [peptide VPIa 
(SEQ ID NO:95) ; peptide VPlb (SEQ ID NO:96) ; peptide VPlc (SEQ ID NO-97) ■ 
peptide VPld (SEQ ID NO:98) ; peptide VPle (SEQ ID NO:99) ; peptide VPlf (SEQ 
ID NO: 100)], ou des fragments de la proteine VP2 [peptide VP2a (SEQ ID NO- 101) • 
peptide VP2b (SEQ ID NO:102) ; peptide VP2c (SEQ ID NO:103) ; peptide VP2d 
(SEQ ID NO: 104)] ainsi que les peptides derives comprenant 7 a 50 aminoacides. 

20°) Compositions immunogenes comprenant un ou plusieurs 
produits de traduction des sequences nucleotidiques selon la revendication 17 et/ou 
I'un des peptides ou proteines selon la revendication 18 ou la revendication 19. 

21°) Anticorps diriges contre I'un ou plusieurs des peptides ou 
proteines selon i'une quelconque des revendications 17 a 20. 

22°) Procede de detection immunologique d'une infection a erythro- 
vims V9, caracterise en ce qu'il comprend : 

- pour la detection des anticorps anti-erythrovirus V9. la mise en 
contact d'un echantiUon biologique avec un peptide selon I'une quelconque des reven- 
dications 17 a 19 (serodiagnostic), 

" PO"'" detection des proteines virales d'erythrovims V9, la mise en 
contact d'un echantillon biologique avec un anticorps selon la revendication 21 ; 
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la lecture du resultat etant revelee par un moyen approprie, notam- 
ment EIA, ELISA, RIA, fluorescence. 

23*^) Trousse de diagnostic d'erythrovirus, caracterisee en ce qu'elle 
inclut au moins un reactif selon la revendication 11 et/ou une paire d' amorces selon la 
revendication 6 et/ou un peptide selon Tune quelconque des revendications 17 a 19 
et/ou un anticorps selon la revendication 21. 
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569 Ava II 
510 Nhe I 
136 Gdi tl 
136 Eaet 
86 Bbs I • 

63 BsiE I - 907 



1990 Mmel 

1967 Ava 11 • 

1964 Ben 1 • 

1963 Bcnl* 

1 963 Ava I • 
1921 Narl 
1921 Kasi 
1921 Hae II 
1921 Ehel 

1921 Bbe I • 3161 ANv I 

1921 Ban I • 3125 Afl III 

1694 AlwNI* 3051 Bsg I • 

1617 SphI 2945 Bgl I 

1393 XmnI 2711 Ben I • 

1251 Afl III- . ^ 2672 Bbs 1 • 

1231 AIw I • 2036 Hind III 2937 Bsg 1 • 

1141 Spel 1815 Bgl II. 2634 Bsgl. 
Ple I 1 543 Ben I • 2388 Afl III - 3475 



4345 Avr I! < 
4269 Sac I 
4269 Ed136 I 
4269 Ban 11 • 
41 57 Afl II 
4005 Ben I • 
4004 Ben 1 • 
3907 Aec I • 

4004 Ava I • 
3936 AlwN I • 
3851 Bbs I • 
3823 Ava II • 
3802 Kpn I 
3802 Ban I • 
3802 Acc65 I 
3692 AIW I 



4961 BsiE I 
4936 Bbsl- 
4832 Af[ III • 
4504 Taq I 

4792 AlwN I • 
4662 BceF I • 
4499 Ava 11 • 



Alw I 



4249 Ban II 




V9.SEQ ID NO 1 



5028 pb 



Enzymes Acci I a BsiE I 



2059 Dpn I • 
2036 Hind III 
1943 BstU |. 
= 1921 Narl 
KasI 
Hae 11 
Ehel 
Bbel 



4969 BsrF I 



514 
510 
136 Gcfi II 
136 Eae I- 
65 BsrF I • 
55 BsrF I • 



BspM I 
Nhe I 



1921 
1921 
1921 
1921 

,3«x™r'*' 3,61 o'p;T."''3«7«cr P-^I 

«rpSr'-,s,3c.;vf.^" .^n^f.'- 3«.^i?f"'- 



4431 Dsa I - 
4401 Dra 111 - 
4272 Ear I • 
4269 Sac I 
4269 Edi 36 I • 
4196 EeoN I • 
3921 BsmA 1 • 
3837 Dpn I • . 
3822 EcoOl09 I • 
BspH I • 4345 Avr II 
3907 Ace I 
3802 Kpn I 
3802 Ace65 I 




V9.SEQ ID NO 1 



5028 pb 



Enzymes Bsm I a EcoR I 



FIGURE 7,1 
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2241 HinP 1 • 
2100 Fok I • 
2036 Hind ill • 
1990 Mmei 
1 964 Nci I • 
1963 Neil • 
1944 HinP I . 
1944 Hhal • 
1922 HinP I . 

1922 Hhal- . , 

1 921 Nar I - ^ "^"^ * * 

921 . "^^^ 

W«o I Avrll 
It?:] t??® " . 4269 Sad 



4431 Nco|. 



1921 Ehe I • 2754 Hae III • 40O8 Hae lir 

1921 Bbe I 2730 Hae III . 3907 Accl 

1640 Fok 1 . 2711 Nci I • 3^86 Hae ill • 

tz<rs Kii. . ^^^'^ ^P^' 2388 Mae II- 3238 HglA I • 4157 ah 11 

jiff Br 

/" ' ' ' " I II nil » I minii iii 1 n m mm, .. „ „„ , 

V9.SEQIDN0 1 5028 pb Enzymes Ehe I a Nco I 



2059 Sau3A I • 
1990 Mmel 
1963 Sma I • 
. 1 921 Nar I 
1921 KasI 
1921 Hae II 
1921 Ehei 
1816 Sau3Ai- 
1815 Bglll 
1617 Sph I . 
1617 NspC I • 
1393 Xmnl 
1363 PflMI. 
1318 Seal- 
1315 PflMI • 
1251 NspC I - 2244 Sic 1 - 

1251 Nsp7524|. 
qift MK f^^'' 1801 SfaNI. 

219 PvuS. .'o^.' c^'P'- 2036 Hindlll 

72 SfaNI. 793 S% I. 15lTsa?|Sl: 



4400 PflM I . 
4381 Sspl- 
4345 Avrll 
4289 Pvu II . 
4289 NspB II . 
4269 Sad- 
4269 Ed 136 I 
4179 NspC I - 
3965 Sea I • 
3748 Sfc I • 4557 Pvu II - 

3720 Pvoj II . 4557 NspB II • 

3720 NspB II • ^ 
3476 Sau3AI- 4363 SfaM I • 
o.^o^i^.^ ^'^'^ ' ' '^''^^ Nsp7524 I . 
3 6^' S?u?i ; f ' • ^^^2 NspC I . 

294?^ ' • ^^^2 Kpn I 4504 Taq I 

2945 Bgl I 3593 Sau3A I - 4601 ^faw 1 

2940 Pvu II . 3748 Pst I • 449^ Pr^m ' 

2940 NSPBII. 3802 rcc65I 4f96^fc|: 




V9.SEQIDN0 1 



Enzymes Nci I a Ssp I 
FIGURE 7.2 
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2036 Hind III 

1990 Mmel 4431 Sty I • 

1963 Xmal* 434S Sty I • 

1921 Narl 4345 Avr II 

1921 Kast 4269 Sact 

1921 Haell 4269 Ecl136l 

1921 Ehel 4157 Afl II 

1393 Xmn I 40O4 Xma I • 

510 Nhel 1141 Spel 1921 Bbe I 3907 Acc I 

136 Gdill 980 Sty I • 1815 Bglll 2945 Bgl I 3802 Kpn I 4504 TaqI 

136 Eael 907 Pie I 1617 Sph I 2584 Sty I • 3802 Acc65 1 4662 BceF I 

I I M I I 1 I ini I I I [ I I I I 1 1 I ^ 

V9.SEQ ID NO 1 5028 pb Enzymes Stu I k Xma I 



FIGURE 7.3 
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